2025 年的今天,AI 眼镜越发成为焦点情欲印象剧情,好像咱们不错勇猛地意料,异日的 AI 助手不是藏在手机 App 里,而是戴在你脸上、看你所看、答你所问。
4 月举办的 TED 大会上,Google 也给出了我方的谜底。在 TED 官方上周最新发出的视频中,谷歌初度公开展示了搭载 Android XR 的 AI 眼镜,如安在 Gemini AI 的加握下如何运行:
不仅能听懂讲话、即时翻译,还能「看见」天下,以致记取用户曾看过的物体、识别书名、平直播放唱片上的音乐、肖似导航指示。
图/ TED
这场现场演示,也再次激励了外界关于 AI 眼镜的平常热议。诚然,这不是 Google 第一次作念眼镜,也不是第一款 AI 眼镜,但它背后是 Google 最新构建的 XR 系统平台 Android XR,亦然 Gemini 大模子初度与实践空间深度和会的遵守。
尤其在 Meta、Rokid、雷鸟等厂商接连发布 AI 眼镜后,Google Android XR 的此次「下场」,也被视作 AI 眼镜「平台战役」的新军号。但 Android XR 能够复制 Android 在智妙手机商场的得胜吗?好像很难。
Google 作念的 AI 眼镜,到底有什么不同样?
在 TED 放出演讲视频《The next computer? Your glasses》中,能够很明显看到 Google 打造的 AI 眼镜,很像一副普通眼镜。别误解,这是大势所向。
开心色播进行演示的 Google AI 眼镜,图/ TED
不同于 AR 眼镜昔时的张扬假想,今天 AI 眼镜追求的便是越像普通眼镜越好,以便于破钞者在日常活命中无感地进欺诈用。包括 Google 这副看似朴素的智能眼镜,一初始好像不如 Vision Pro 那样炫技,但当 AI 初始果真「看懂」天下,它开释出的后劲,弥散让东说念主再行念念象 AI 眼镜的异日。
其中最激励热议的,便是 Gemini 展示出的「缅念念」身手。
咱们可能皆见过这么的演示:戴着 AI 眼镜对着某个画面研讨 AI。不外 TED 现场的演示中,Google 不仅仅展示了这类及时反应,让 Gemini 看着现场写俳句(日本的一种古典短诗)。
但更让东说念主惊喜的是,Google 职工 Nishtha Bhatia 仅仅轻轻瞥了一眼死后的书架,然后背身再等了一段时间,才研讨眼镜「背面架子上那本白色封皮的书叫什么?」,随后 Gemini 秒答:
那是詹姆斯·克利尔所著的《Atomic Habits》(华文版译名为《掌控风气》)。
Gemini 有缅念念的身手,图/ TED
不仅如斯,Gemini 还能提前记取看过的信息,然后在之后的研讨中平直告诉 Nishtha Bhatia 房卡放在了唱片傍边。比拟之前 AI 眼镜只可「问答」或「识图」,Google 此次展示的 AI 眼镜情欲印象剧情,在「麇集性」和「凹凸文感知」方面,不错说迈进了新的维度。
这不是传统风趣风趣上的图像识别,而是近乎具备了「视觉缅念念」的 AI。用户视野也曾离开,AI 却「记取了」也曾看到的物体。换句话说,它也不仅仅识别「是什么」,而是果真能相识「你在问什么」。不外 Google 也留住了一些疑问:
AI 眼镜上 Gemini 的「缅念念窗口」能有多长?
但岂论如何,这皆是咱们之前在悉数 AI 眼镜中,没能看到的。自然,这主要照旧收获于 Gemini 模子的身手,表面上跟着其他第三方大模子的迭代和开释,其他 AI 眼镜也能终了。
AI眼镜=AI+AR,这亦然Google的见解
TED 现场的这场演讲之是以激励平常存眷,不仅因为 Gemini 的「缅念念力」冲破,更因为 Google 此次交出的,是一副具备 AR 自大身手的 AI 眼镜。
存眷 Google Project Astra 姿首标一又友可能还会铭记,2022 年谷歌官宣收购了一家名为 Raxium 的 MicroLED 自大屏公司,其时就激励了诸多猜念念。而在 TED 演讲中,Google XR 发达东说念主 Shahram Izadi 就袒露,现场演示的 AI 眼镜搭载了 MicroLED 自大屏。
Shahram Izadi 展示 AI 眼镜自大屏,图/ TED
从视频中的演示也不错看出,Gemini 的交互界面平直出当今镜片中,不仅仅在耳边修起,还会透过光波导镜片展当今咫尺。这种形态 AI 眼镜的上风,咱们也曾说过许多回:
中枢在于纯语音交互自然存在体验上的抑制,而视觉+听觉的交互体验,更顺应东说念主类天生的领路和交互风气。
照旧拿 Google 的现场演示来说,Gemini 能够在回复——不管是回答照旧翻译平直呈当今咫尺让东说念主阅读,不仅行动不雅众的他者,就连进行演示的 Nishtha Bhatia 本东说念主也能格外高效地了解信息,而无谓恭候 Gemini 的逐词念出。更无谓说,嘈杂环境下,就连更围聚耳说念的开放式耳机也很难,遑论 AI 眼镜。
除此除外,自大身手的加入也带来了更多的交互可能,比如最平直的便是——AR 导航。通过将数字信息透过眼镜叠在咫尺,Google AI 眼镜能够进行在实践空间中进行径用户进行更直不雅的导航,包括骨子的方针、距离和阶梯。
这种轻量化 AR 身手的加握,自然也不仅仅 Google 一家在作念。
Rokid Glasses,图/ Rokid
事实上,雷科技屡次在 AI 眼镜报说念中提到的 Rokid Glasses 就率先继承了这种 AI+AR 的阶梯,配备了双目 AR 自大,守旧信息推送、空间导航、翻译字幕、AI 对话等功能。另一边,Meta 与雷一又(Ray-Ban)合作的下一代智能眼镜,也被英国《金融时报》爆料将在本年晚些时候加入 AR 自大功能。
但念念要作念好 AI+AR 自大,并不轻视,其实背后蕴含的是对空间感知、视觉识别和语义推理的整称身手,同期也代表了 AI 眼镜从「语音驱动」率先到「多模态交互」的要紧节点。
Google 欲再造Android遗址,但很难
Google 此次带来的 AI 眼镜背后,是一个新名字——Android XR。自然披着 Android 的外套,但它其实是 Google 为 XR(扩张实践)缔造打造的一套全新操作系统架构,主打和会语音交互、视觉感知和空间定位等身手。
换句话说,它不是给手机用的 Android,而是 Google 念念鄙人一代运筹帷幄平台上,再复制一次 Android 的生态遗址。
但实践是,今天的 AI 眼镜,不是 15 年前的智妙手机。
回看 AI 眼镜行业的近况,咱们险些看到每一家头部厂商皆在自研操作系统。Rokid 自研了空间操作系统 YodaOS-Master,这是专为空间运筹帷幄与多模态 AI 交互假想的操作系统。Meta 也有我方的 Horizon OS,不仅强调空间操作系统定位,以致臆想打算向第三方开放。
YodaOS-Master,图/ Rokid
轻视来说,大家早已不再指望 Android 给 XR 提供谜底。Google 推出 Android XR 时,自然能打出「兼容 Android 应用」的上风牌,但这张牌,实践里其实越来越轻了。
智妙手机之是以需要操作系统尺度,是因为它承载的是高频 App 使用场景:打法、支付、文娱、舆图……皆需要一个富厚的生态容器。
但 AI 眼镜不是手机,它的中枢交互逻辑并不依赖「盛开某个 App」,而是基于语音、图像和凹凸文相识的即时反应。在 TED 的演示中,咱们也不错看到,用户不需重心击任何图标,不需要跳转任何应用——惟有说出来、看昔时、问一句,就能触发系统扩充:
- 看到书架,问书名;
- 看向唱片,播放歌曲;
- 嘴里说「去哪」,导航就伸开。
这些体验许多皆不太依赖弘大的 App 生态,而更接近劳动即操作、意图即扩充的系统级合作。硬要说的,Gemini 或者说 AI 才是果真的枢纽。在这方面,Gemini 很强,但还远不行「力压群雄」。
写在终末
从 TED 演示的那副眼镜开拔,咱们看到 Google 正试图用 Gemini 重构 AI 眼镜的交互神情,并借由 Android XR 再次发起一场平台级的弥留。它作念出了果真「看得见」的 AI 眼镜,也带来了缅念念、导航、翻译等一整套高出传统的体验。
但要构建一个果真风趣风趣上的平台,靠炫方针演示还远远不够。Android XR 濒临的不仅仅本事挑战,还有群雄的商场款式,以及用户交互移动的巨大挑战。包括当用户不再「盛开 App」,而是与 AI 平直对话时,什么才是平台?
这亦然 Google 此前悉数 XR 姿首永远未能落地的要害地方——它太擅长构建系统,却永远没找到下一个系统存在的原理。
但岂论如何,AI 眼镜如实展现了成为新一代个东说念主运筹帷幄平台的巨大后劲,至于 Android XR 能不行成为阿谁界说尺度的平台,照旧需要咱们抱有耐烦情欲印象剧情,见证历史。