都说谷歌被OpenAI狙击了，我何如合计它在狙苹果

发布日期：2024-05-18 23:09 点击次数：63

谷歌的 I/O 2024 大会如约而至了。。。

发布会是在好意思国山景城开的，咱差评剪辑部也派东谈主去了现场，听身处前哨的共事讲，不知谈是不是 OpenAI 抢了风头的起因，本年现场的氛围似乎都没前几年那么搅扰了。

在以前，用万国来朝刻画 I/O 大会都不为过，而本年很昭着东谈主没那么多（不外以前有卖门票，此次没卖）。

不外这毕竟照旧谷歌，在整整快两个小时的发布会里，蹲在屏幕前看的世超，照旧被秀了好几波肌肉。

粗浅一句话空洞，和 OpenAI “ 小而好意思 ” 的春季发布会比起来， I/O 大会完全等于 “ 大而全 ” 。

归正等于各式和 AI 能挂中计的东西，他们都来了一遍，从最基础的大模子，到能生成视频、音乐的 AI ，再到 TPU 芯片等等。

世超也从里面挑了几个比较亮眼的产物，来和大伙说谈说谈。

领先，世超合计，OpenAI 发布会等于对着谷歌狙击的。。。

谷歌此次重心推出的多模态 AI 助手Project Astra ，和 OpenAI 的 GPT-4o 着实没差，都是能和多模态及时交互的 AI 。

把麦克风、录像头的权限给 Project Astra 之后，它能眼不雅六路、耳听八方，璷黫问啥，它都能第一本事给出恢复。

比如让它望望办公室里有莫得会发出声息的东西，当镜头扫过一个音响时，它立马就能响应过来。

念念再了解了解音响的构造啥的，也能径直在屏幕上写写画画，然后发问，通盘经由 Project Astra 整个能看懂。

况且因为有最新的 Gemini 在背后撑腰，它的相识材干亦然一绝。

立地找到一个措施员的工位，指着屏幕里的代码问是干啥的， Project Astra 没响应几秒就能给出谜底，况且还能准确说出用了啥代码。还有搞个 “ 薛定谔的猫 ” 梗图，它也能飞速猜出来。

不外它和 GPT-4o 照旧有点差异在的，等于言语的口吻语调啥的，没 GPT-4o 的东谈主味儿那么重， Project Astra 稍稍有点高冷的滋味。

况且 Project Astra 身上还有一个 GPT-4o 没展示的手段，有驰念，比如在演示里， Project Astra 能准确记取，镜头一扫而过的桌子上，放了一个苹果。

这对及时交互 AI 来说，算是格外要津的一个材干了。不外在前哨的共事跟世超说，当今 Project Astra 就只可记一分钟的事儿，但之后上线的版块详情能记更多。

但有一说一，就算是世超，也不成把往时一分钟看到了东西一五一十的全记下来。。。

要不是 GPT-4o 照旧抢先亮相了一波， Project Astra 一定会被各路媒体打上 “ 炸裂 ” 、 “ 史诗 ” 、 “ 颠覆 ” 、 “ 改写历史 ” 的标签。

可惜，只是是晚了一天，当今群众对 Project Astra 的刻画唯有一个标签： “ 跟 GPT-4o 大略 ” 。

诚心提倡谷歌持一下内鬼。

除了多模态及时交互的 AI 外，谷歌还一次性放出了各式单独的多模态 AI ，有文生图的 Imagen 3 ，文生视频的 Veo ，文生音乐的 Lyria 。

而这些，世超合计，等于摆明了对标市面上的那些 Sora 、 Suno 之众。

像是文生视频的 Veo ，从 1080p 的画面成果，还有 60 秒的时长，都要和 OpenAI 的 Sora 看王人。

不外谷歌没学 Sora 用 DiT （ Diffusion Transformer ）架构，而是我方揉了好几个老模子，像是 GQN 、 DVD-GAN 、 Imagen-Video 、 Phenaki 、 WALT 等等。

从终末生成视频的成果来看，和 Sora 也照实有的一拼。

谷歌自个儿也说了， Veo 能支配各式作风，航拍、延时影相等等镜头语言都能秒懂。。。

有益旨真谛的是，谷歌在每个视频底下都专诚标了一排小字：扫数视频均由 Veo 生成，未经修改。

在点谁应该就无谓世超多说了吧。。。

而除了上头这些，谷歌还推出了对标 GPT-4 Turbo 等轻量性能大模子的 Gemini 1.5 flash 、对标 llama 3 等开源大模子的 Gemma 2 ，还有 Google 自家的新 TPU 等等。。。世超在这儿就不逐个先容了。

归正看起来，股指配资谷歌似乎不肯毁灭AI 范围里的每个赛谈，念念把我方打酿成一个 AI 界的六边形万能战士。

而更可怕的是，在各个范围里， Google 比拟友商天然都不一定是最佳的，但也并不逾期几许。

同期，谷歌的上限和无餍，详情不限于此。因为谷歌还拿出来些不少其他大厂单打独斗，透彻拿不出来的东西。而世超合计，恰是这些东西，有契机能让谷歌从AI 范围的追逐者，置身为领跑者。

因为谷歌，领有其他AI 巨头所莫得的熟识系统与诳骗生态。

此次 I/O 大会上，谷歌就展示了好几个这样的例子。

比如他们先展示了一波 Gemini 和 Google 相册的蚁合。记不清自个儿车的车招牌，在 Google 相册里搜索 “ 查找车招牌 ” ， Gemini 能径直从图库里准确找到车的相片，并把车招牌告诉你。

还有在谷歌 Gmail 邮箱里，你也能让 AI 帮你查航班信息，在谷歌舆图里，能让 AI 帮手赢得货仓隔邻的餐厅和旅游景点，再给策动相应的日程。

这还没完，谷歌的本钱行搜索此次也上 AI 了，况且一上来就搞了波大的，接济语音、图片，还有视频搜索。

比如说唱片机坏了念念查查原因，径直镜头瞄准故障位置问就行了， AI 会立马响应给出谜底。

还有压箱底的胶片机不何如会使，相通拍给它看就行了，不需要我方再苦思恶想去刻画。

只不外，此次谷歌又在演示上翻车了。。。有媒体扒出，胶片机的阿谁回答完全等于在瞎说，回答中的一个提倡是 “ 把菲林取出来望望 ” ，而这样只会让整卷菲林径直报废。。。

不外，这至少讲明他们玩儿的等于个 real ，毕竟大模子乱讲话这事儿一直存在，而出错，比作秀照旧强一些的。

总之，按照谷歌的说法， Gemini 大模子正在全面整合谷歌的那一群众产物中，包括在改日，他们将把AI 直构建到 Android 操作系统的底层之中，准备改写用户和手机之间的交互方法。

他们也举了一些例子，像是用手机看球时，不知谈解析员犯没犯规，圈起来就能问，还有作念题时圈一圈就能搜题。

况且流露谜底的时候，它也不会跳转到别的 AI 软件里面去，属于是把 AI 融到系统最最最底层了。

甚而在打电话的时候， AI 还能及时反诈，能从对话中径直判断对方是不是骗子，如果有可疑的字眼，立马会弹窗教唆。

其实看到这的时候，世超照旧感受到了谷歌作念 AI 的上风，改日 AI 详情要朝着底层生态去发展。

而行为一家大企业，谷歌手里的资源是格外多，况且还有安卓这个大阵营，它能松驰把 AI 打入安卓里面，但 OpenAI 要和 iOS 深度蚁合，揣摸没这样附近自由了。

总之此次谷歌的 I/O 大会啥产物都有，但要说名满全国，还谈不上。不外，在AI 诳骗集成这一个最直面消耗者的维度上看，谷歌还确凿咫尺 AI 范围的集大成者之一。

这一波，客岁还被称作是 AI 圈 “ 仲永 ” 的谷歌，算是渐入佳境了。

不外世超看完谷歌的 I/O 大会，倒合计他们此次不单是要 “ 狙击 ” OpenAI ，更要把苹果生态也沿途狙了。。。

是以下一趟合，到苹果你了。

上一篇：星河证券：游戏、影视院线等行业将当先考证AI降本增效
下一篇：中北能（CNEY.US）5月16日收盘报0.67好意思元/股，跌1.37%

股票杠杆

都说谷歌被OpenAI狙击了，我何如合计它在狙苹果