第2024章 AI大模型：Sola横空出世，百模大战“日日新”（AI月报） (第1/2页)

《Kimi人工智能月度报告丨AI大模型》

关键词：Sora"VS"日日新

1．OpenAI推出人工智能视频生成模型“Sora”

2024年2月15日，美国人工智能研究公司OpenAI推出了一款视频生成模型“Sora”，并发布48个文生视频案例及技术报告。OpenAI的官网介绍称，使用这款模型可以用文本生成长达一分钟的视频，视频可具有多个角色、特定类型的运动、精确主题和背景细节等复杂场景。该公司称，开发这一模型旨在教会人工智能理解和模拟运动中的物理世界，并训练其帮助人们解决需要现实世界互动的问题。该模型可以深度模拟真实物理世界，标志着AI在理解真实世界场景并与之互动的能力方面实现了重大飞跃。对于任何需要制作视频的艺术家、电影制片人或学生来说，这都带来了无限可能。

在针对“Sora”的介绍中，OpenAI还指出，当前的模式存在弱点，可能难以准确地模拟复杂场景的物理表现，也可能无法理解因果关系的具体实例。同时，该模型还可能混淆诸如左和右这类的空间细节。

2．谷歌推出轻量级开放人工智能模型Gemma

2月21日，谷歌发布一个名为Gemma的开放人工智能模型，该模型是使用与构建Gemini人工智能模型相同的研究和技术创建的。该公司提供了两种不同尺寸的Gemma——Gemma2B和Gemma7B。二者都带有预先训练和指令调整的变体，并且都足够轻量，可以直接在开发人员的笔记本电脑或台式电脑上运行。谷歌表示，在关键基准测试方面，Gemma超越了更大的模型，并且两种模型尺寸都优于其他开放模型。该公司表示，目前正在公开关键的技术数据，例如“模型权重”。

3．谷歌发11B基础世界模型，生成交互虚拟世界

谷歌发布根据互联网视频训练的基础世界模型Genie，该模型参数规模为11B，可以从合成图像、照片甚至草图生成无数种动作可控的交互式环境。Genie可以用它以前从未见过的图像提示，例如现实世界的照片或草图，使人们能够与他们想象的虚拟世界进行交互。

4．美国Groq公司开发出新型大模型推理芯片

2月19日，美国人工智能初创公司Groq发布新型大模型推理芯片LPU（语言处理单元）。LPU是一种新型的端到端处理单元系

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

↑返回顶部↑