第2024章 AI大模型:Sola横空出世,百模大战“日日新”(AI月报) (第1/2页)

加入书签

《Kimi人工智能月度报告丨AI大模型》

关键词:Sora"VS"日日新

1.OpenAI推出人工智能视频生成模型“Sora”

2024年2月15日,美国人工智能研究公司OpenAI推出了一款视频生成模型“Sora”,并发布48个文生视频案例及技术报告。OpenAI的官网介绍称,使用这款模型可以用文本生成长达一分钟的视频,视频可具有多个角色、特定类型的运动、精确主题和背景细节等复杂场景。该公司称,开发这一模型旨在教会人工智能理解和模拟运动中的物理世界,并训练其帮助人们解决需要现实世界互动的问题。该模型可以深度模拟真实物理世界,标志着AI在理解真实世界场景并与之互动的能力方面实现了重大飞跃。对于任何需要制作视频的艺术家、电影制片人或学生来说,这都带来了无限可能。

在针对“Sora”的介绍中,OpenAI还指出,当前的模式存在弱点,可能难以准确地模拟复杂场景的物理表现,也可能无法理解因果关系的具体实例。同时,该模型还可能混淆诸如左和右这类的空间细节。

2.谷歌推出轻量级开放人工智能模型Gemma

2月21日,谷歌发布一个名为Gemma的开放人工智能模型,该模型是使用与构建Gemini人工智能模型相同的研究和技术创建的。该公司提供了两种不同尺寸的Gemma——Gemma2B和Gemma7B。二者都带有预先训练和指令调整的变体,并且都足够轻量,可以直接在开发人员的笔记本电脑或台式电脑上运行。谷歌表示,在关键基准测试方面,Gemma超越了更大的模型,并且两种模型尺寸都优于其他开放模型。该公司表示,目前正在公开关键的技术数据,例如“模型权重”。

3.谷歌发11B基础世界模型,生成交互虚拟世界

谷歌发布根据互联网视频训练的基础世界模型Genie,该模型参数规模为11B,可以从合成图像、照片甚至草图生成无数种动作可控的交互式环境。Genie可以用它以前从未见过的图像提示,例如现实世界的照片或草图,使人们能够与他们想象的虚拟世界进行交互。

4.美国Groq公司开发出新型大模型推理芯片

2月19日,美国人工智能初创公司Groq发布新型大模型推理芯片LPU(语言处理单元)。LPU是一种新型的端到端处理单元系

更多内容加载中...请稍候...

本站只支持手机浏览器访问,若您看到此段落,代表章节内容加载失败,请关闭浏览器的阅读模式、畅读模式、小说模式,以及关闭广告屏蔽功能,或复制网址到其他浏览器阅读!

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

↑返回顶部↑

上一章 书页/目录 下一页

其他类型相关阅读: 盗墓:失落上古文明之归藏古国 在柯南世界当血族 盗墓,路飞要拯救世界 我家中单很柔弱的[电竞] 全球异变:向导为首 贝利亚,托雷基亚,草帽团新成员 骑行异事 星际第一菜农 C罗求我别归化,呦西羡慕哭了 末世:对,没错,我就是末世圣人 魇日纪元 紫藤神探 末世无相 宿主她被迫沦陷 末世病毒体 当我提不动刀了?[电竞] 志村团藏的人生模拟系统 穿越未来之星际药膳师 我们打野似鸽神手[电竞] 斗罗:重生成团宠,我疯狂开挂