360GPT 360智脑全家桶

360通过录屏形式展现了大模型在输入输出上的多模态能力，包括文生图、图生文、视频生文、文生视频。工作人员可以通过输入文字来要求大模型作画，还可以输入一张图片、一段视频来要求大模型用文字讲解图和视频中的内容。

周鸿祎认为，ChatGPT聊天机器人为同行指明了大模型发展路径的同时，也引导各家在文字输入输出表现上的较量，主要通过微调来实现。而下一步竞争的焦点在于多模态。目前GPT-4已经展现了这方面的部分能力，未来的GPT-5会全面支持多模态。

360数字人广场的平台，内含有200多个角色，主要有两大类，一类是数字名人，一类是数字员工。

该数字人被360定义为在“360智脑”大模型的通用智能基础之上、融合多模态能力的产物——传统的2D或3D数字人主要通过动作捕捉、智能合成，再加上渲染生成虚拟人形象，但却不具备生成内容的能力。例如数字人主播只能按给定脚本“念稿”，而基于大模型的数字人模仿人的思维有人设、能对话、能互动，今后还会加入记忆功能，未来会是“有灵魂”的数字人。

周鸿祎将数字人视作大模型未来落地的一大关键应用场景，“未来人工智能的发展不仅仅只有大模型核心能力的增加，各种外部功能的包装、产品的定义会让人工智能跟我们每个人的工作、生活贴得更近，会让每个人更自如地使用人工智能。”

ꄴ前一个：无

ꄲ后一个：无