91中文网

手机浏览器扫描二维码访问

本站弹窗广告每日仅弹出一次
尽可能不去影响用户体验
为了生存请广大读者理解

一文搞懂世界模型:ai如何“脑补”真实世界?(第2页)

自动驾驶汽车需要应对各种复杂路况,世界模型能帮助它提前“预判”可能出现的危险,做出更安全的决策。比如,当自动驾驶汽车遇到前方突然变道的车辆时,世界模型可以根据车辆的速度、距离以及周围环境信息,预测出可能的碰撞风险,并及时调整车速和行驶方向。

华为云的盘古世界模型在自动驾驶领域就有应用。输入首帧的行车场景,再加上行车控制信息和路网数据,它就可以生成每路摄像头的行车视频和激光雷达的点云,生成的视频与激光点云可以达到像素级的匹配。这就能够为智能驾驶生成大量的训练数据,从而不依赖于高成本的路采。并且它的生成能力可以达到30帧每秒的视频续写,已经应用到自动驾驶的软件仿真和硬件仿真的环境中,根据行车控制信息就可以实时生成左超车、右超车、刹车等不同驾驶行为的续写视频,供智能驾驶系统来训练。

这章没有结束,请点击下一页继续阅读!

(三)机器人领域:让机器人更“智能”地行动

机器人在执行任务时,需要理解周围环境并做出合理的动作。世界模型可以让机器人在虚拟环境中进行“试错学习”,提高在真实环境中的行动能力。比如,一个机器人要在杂乱的房间里寻找特定物品,有了世界模型,它可以先在虚拟环境里模拟寻找的过程,预测可能遇到的障碍和问题,再在真实环境中更高效地完成任务。

谷歌的Genie 3世界模型可以生成各种可控制动作、可玩的3D环境,还可以用于训练和评估具身agent。它能快速为AI agent创建丰富多样的环境,从而生成agent在训练期间未见过的评估任务。比如,Google DeepMind与游戏开发商合作开发的SIMA agent,被设计成通过遵循自然语言指令来完成一系列3D游戏世界中的任务,就可以在Genie 2合成的、未见过的环境执行指令,通过在虚拟环境中的训练,提升在真实世界中的行动能力。

(四)影视与元宇宙:提升内容创作效率

在影视制作和元宇宙场景搭建中,世界模型可以快速生成大规模动态场景,节省大量的人力和时间成本。比如,制作一部科幻电影,导演可以用世界模型快速生成外星世界的场景,包括地形、气候、生物等,而且这些场景可以根据剧情和角色的行动实时变化。在元宇宙中,用户也可以通过世界模型创建属于自己的个性化虚拟空间,实现更丰富的交互体验。

三、深入剖析:世界模型的技术原理是怎样的?

(一)多模态数据融合:让AI“全方位”感知世界

世界模型的核心之一是多模态数据融合,也就是把视觉、语言、音频、动作等多种数据整合在一起。比如,当我们看到一个人在说话,我们不仅能看到他的动作和表情(视觉信息),还能听到他说的话(音频信息),然后理解他的意图(语言信息)。世界模型也需要具备这样的能力,将不同模态的数据转化为统一的表示形式,让AI能够从多个角度理解世界。

以腾讯的混元3D世界模型为例,它引入了“世界一致视频扩散”与“长距离世界探索”两大核心机制,从一段文字、一张图生成一个初始场景,再根据用户设定的相机轨迹拓展新视角内容。这里就融合了文本和图像两种模态的数据,通过对这些数据的处理和融合,生成更加真实、连贯的虚拟场景。

(二)模拟与预测:在“脑海”中推演未来

世界模型还能够模拟世界的动态变化,并预测未来可能发生的事情。它通过学习大量的历史数据,掌握世界的运行规律,然后在面对新的情况时,能够在虚拟环境中模拟不同的行动方案,并预测每种方案可能产生的结果。

比如,在自动驾驶场景中,世界模型可以根据当前车辆的速度、位置、周围车辆的状态等信息,模拟未来几秒钟内可能出现的情况,如前方车辆突然刹车、行人突然横穿马路等,并提前规划出应对策略。谷歌的Genie 3就可以生成长达数分钟的一致世界,能够模拟各种物体的相互作用、角色动画、物理规律等,实现实时互动和高度一致化的生成,让用户在其中的行动能够得到合理的反馈和预测。

(三)强化学习:在“试错”中不断优化

强化学习是世界模型训练过程中的重要方法。简单来说,强化学习就是让AI在虚拟环境中不断尝试不同的行动,根据行动产生的结果获得奖励或惩罚,从而逐渐学会最优的行动策略。

热门小说推荐
我!清理员!

我!清理员!

“拿好,这是你这周的薪水。”抬手递了个小袋子过来后,桌后面翘着二郎腿的女人随手在小本子上勾了一下,随即头也不抬地挥手撵人道:“记得自己去报一下税……下一个!”“等等!”把小袋子里的钱币倒出来后,看着掌心八枚大的一枚小的,总共九枚脏兮兮的硬币,李昂不由得震惊地瞪大了双眼,恨不能当场扑过去和她决一死战。“该死的!我这周二才刚击退了妄图侵蚀世界的邪神!你个混蛋居然连救世主的工资也要扣?”...

[韩娱]见异思迁

[韩娱]见异思迁

o18kan(o18kan)如果死亡可以回避,那爱呢?她纤细笔直的双腿,散发着桃香的手掌,柔软白嫩的身体,娇艳妍丽的面容。如果爱可以回避,那她呢?号称南韩raer&roducer的门面的孟熹佑,据说是raer理想型,同样也是raer收割机。怀念我们曾经一起通宵快乐的日子。我们相遇就是以热制热的最大值。仅仅注视着你的眼睛,就能让我空荡荡的心填满。你就是我的蓝月与星光。等了很久吧?你好,我的soulate。...

一剑一棺一杀神

一剑一棺一杀神

三年前,少年慕枫抬头望天,于烈日中窥见一背棺女子,自此他丹田消失,沦为废人;三年后,烈日中的仙棺坠落凡尘,化为慕枫的丹田,于是慕枫便开启了一段轰轰烈烈的无敌之路。多年以后,慕枫背仙棺,踏仙路,剑指仙穹:“我虽凡人,亦可斩仙!”......

天渊

天渊

百年前,陈青源进入了一个名为天渊的禁区,魂灯熄灭,世人皆认为他死了。今日,陈青源虽然活着走出了禁区,但是修为尽废,灵根断裂。面对红颜的悔婚,各宗的欺压,陈青源该如何是好?“陈青源,我给你两个选择:一,娶我;二......”天渊内生活着一个红裙姑娘,眸若星辰,声音轻柔。“我选择二。”没等红裙姑娘说完话,陈青源毅然决然......

高武:一枪独尊

高武:一枪独尊

简介:肆虐城市、烧杀掳掠的兽人!天空中喷着火焰的巨龙!一次又一次险些毁灭人类文明的魔族以及试图统治人类的仙国文明!这个宇宙,蓝星文明在艰难前行着!从微末中崛起的高中生苏泽,觉醒了神秘系统,拥有无上观想法!拥有杀敌就能变强的特异功能!在艰难险阻中不断前行!多年以后。苏泽一枪破碎虚空,原魔文明的巨大星球在这一枪之下——......

大约在冬季

大约在冬季

暗恋十一年,当了他婚礼的司仪???平凡受x真?男神攻 情不知所起一往而深,张小梁说,乔鑫你别跟我拽这些词儿,我就问你,你和他话都没说过,你怎么就看上他了? 乔鑫表示看上了就是看上了,我要控制得住我绝对不看上他。 累。并且很扎心。 乔鑫在普通高中,他在省重点。 乔鑫在廊坊三本,他在北京五道口。 乔鑫在北京,他在美利坚。 终于,乔鑫回到甘城,而他也回了甘城。 他结婚。 乔鑫是他的婚礼司仪。 然后呢?...