360GPT 360智脑全家桶
360通过录屏形式展现了大模型在输入输出上的多模态能力,包括文生图、图生文、视频生文、文生视频。工作人员可以通过输入文字来要求大模型作画,还可以输入一张图片、一段视频来要求大模型用文字讲解图和视频中的内容。
周鸿祎认为,ChatGPT聊天机器人为同行指明了大模型发展路径的同时,也引导各家在文字输入输出表现上的较量,主要通过微调来实现。而下一步竞争的焦点在于多模态。目前GPT-4已经展现了这方面的部分能力,未来的GPT-5会全面支持多模态。
360数字人广场的平台,内含有200多个角色,主要有两大类,一类是数字名人,一类是数字员工。
该数字人被360定义为在“360智脑”大模型的通用智能基础之上、融合多模态能力的产物——传统的2D或3D数字人主要通过动作捕捉、智能合成,再加上渲染生成虚拟人形象,但却不具备生成内容的能力。例如数字人主播只能按给定脚本“念稿”,而基于大模型的数字人模仿人的思维有人设、能对话、能互动,今后还会加入记忆功能,未来会是“有灵魂”的数字人。
周鸿祎将数字人视作大模型未来落地的一大关键应用场景,“未来人工智能的发展不仅仅只有大模型核心能力的增加,各种外部功能的包装、产品的定义会让人工智能跟我们每个人的工作、生活贴得更近,会让每个人更自如地使用人工智能。”