谷歌和沃尔沃联手给Gemini AI助手添了个新技能:通过车载摄像头看东西,然后告诉你它们是什么意思。在I/O大会上,两家公司宣布,即将推出的沃尔沃EX60 SUV将让Gemini访问其外部摄像头,为车主解读世界。这之所以可能,是因为沃尔沃使用谷歌嵌入式Android Automotive作为其车辆操作系统,这大概相当于你的车有了一个对什么事都有意见的朋友。

第一个应用场景是翻译那些令人抓狂的停车标志——这些标志看起来就像是由一群虐待狂组成的委员会设计的。谷歌设想,配备摄像头的Gemini能够记住路标、解读车道标记,甚至回答关于附近地标或餐馆的问题。该公司表示,它会告诉你能停多久、是否需要许可证以及其他限制——本质上成为全世界最有主见的停车管理员。

“未来,Gemini将让你的驾驶更有帮助,让你在路上时能更多地了解周围环境,”谷歌Android Automotive副总裁Patrick Brady在一份声明中说道,这听起来像是从未经历过堵车的AI写的。

这项功能并非仅由Gemini驱动;它还依赖于EX60的骁龙系统级芯片的计算能力,以及其空中升级软件能力。所以,如果系统误读了标志,至少你知道该怪谁了。

停车标志解读可能确实有用——如果准确的话。但任何试图解读纽约市停车标志的人都知道,连人类都经常搞错。噩梦场景:Gemini错误解读标志,你收到115美元的罚单,或者更糟,车被拖走。谷歌必须把这个功能做对,否则车主们只会禁用它,回到传统的“猜猜看”方法。

有了视觉能力,谷歌还表示,Maps将提供更口语化的导航指令,考虑地标,比如“经过这个红绿灯,在图书馆处下一个左转”。沃尔沃将是首批获得谷歌地图全新沉浸式导航功能的汽车制造商之一,该功能以3D形式渲染路线,图形更逼真,更接近真实世界。因为没有什么比你的GPS告诉你“在图书馆转弯”更“沉浸”的了——而那个图书馆你根本看不见,因为你正忙着躲坑。