主页 > 奥秘杂志 >【GoogleI-O2019】AI黑科技展示:看懂、听懂,比 > 正文

【GoogleI-O2019】AI黑科技展示:看懂、听懂,比

【GoogleI/O2019】AI黑科技展示:看懂、听懂,比助理自动帮你线上租车。

Google 的 AI 助理年年的进化都令人惊艳,今年 Google I/O 一开场桑达尔皮蔡就展示了一连串从图像、文字、语音甚至声响辨识、语音合成等技术整合各项现有资料与服务的应用,AI 不仅有了眼、耳、口,甚至还能和背后的大脑结合并提供服务。这些需要深厚的软体技术实力,而且大部分今年就能推出。

从聊天室反应看来,对那些为了 Pixel 3a 而来的观众来说,这一段展示可能有点无聊,但可以看出 Google 服务未来的大蓝图,甚至网友最爱开玩笑的 AI「天网」雏形。

【GoogleI/O2019】AI黑科技展示:看懂、听懂,比
话题新闻依时间轴排列。
Google 搜寻

Google 搜寻将加强热门新闻和 Podcast 内容的展示,以黑洞这个热门话题为例,搜寻结果将整理出各个面向的主题分类,下方甚至会列出文章时间轴。

现在搜寻结果也会推荐 Podcast ,并且可以在搜寻结果直接播放或者存到播放清单。

另外还可搜寻 3D AR 图片,并且直接投放到所在环境,可以直接查看人体骨骼模型的细节或者将 AR 鞋子搭配现有的衣服。

【GoogleI/O2019】AI黑科技展示:看懂、听懂,比
Google Lens 点菜单。
Google Lens

Google 已经在全球被使用数十亿次,而深度整合服务下 Google 称之「将现实索引化」,比如将镜头指向菜单就能直接圈出热门菜色,并且打开餐厅的 Google Maps 页面,展示菜色的评价;当镜头指向帐单就可以跳到计算机画面。

Google 这次也瞄準一些更细微的生活问题,比如针对不识字或阅读困难者 Lens 可以辨识并把文字直接唸出来,甚至翻译成不同语言。除了欧美语系以外,印度、日语、韩文、中文也有支援。

【GoogleI/O2019】AI黑科技展示:看懂、听懂,比
皮蔡示範 Duplex 上网租车,
几可乱真的语音助理预约 Duplex

先前激似真人对话,可以直接打电话帮你预约餐厅的语音助理技术在 I/O 一出,吓傻一票观众,在美国 44 州推出后也因店家有疑虑,一接通会先声明这是机器助理打来的电话。

现在这个服务推出了文字版。透过网上表单预约常常得填写落落长的栏位和无数页面,现在 Google Duplex 会依据你的日曆、Gmail 等推测你的活动日期,自动填入预约资讯,使用者只要在每个步骤微调并做最后确认即可。

【GoogleI/O2019】AI黑科技展示:看懂、听懂,比
可以完全用语音写 email 并填写标题送出。
语义理解更加人性化

这次 Google 强调在装置端边缘运算的 AI 演算法,缩减演算法所佔的容量大小,并加快速度十倍快,现场也展示可以透过语音与 Google 助理连续对话,并在不同 app 之间快速切换,就像精彩的抛球杂技一样。

例如现场示範不碰萤幕,用语音回覆讯息、开启相簿搜寻图片、分享回讯息中。打 email 时可以辨识哪些是指令,哪些是信件内容。这里也示範另外一个小而让人眼睛一亮的功能,就是直接喊「stop」就可关闭闹钟,不必动手,但看起来似乎更容易赖床了。

助理搜寻间的内容也更加个人化,路线设定和活动都不需要多余的解释。另外在车上的驾驶模式将优先显示 Google 认为你最需要的内容,来电会将通话对象大声朗读出来,不必将视线离开道路。

控制隐私又维持 AI 进化

就像几週前 Google 公布可以设定自动删除历史纪录,这次 Google 强调更容易管理个人隐私资讯,除了在界面上将重点项目放在更显眼的地方,并且会将自动删除功能套用到更多服务。

现在除了 Chrome、YouTube、Maps 都将新增无痕模式,可以不纪录你搜寻、要去或去过的地点。

另外 Google 保护使用者隐私却又能让 AI 持续进化的 Federated Learning,不会上传特定使用者的资料,但会透过终端装置的整合,再将结果上传到全球资料库。以 Gboard 键盘为例,词库将不会出现个人的词语习惯建议,而是建议所有人最常用词彙。

【GoogleI/O2019】AI黑科技展示:看懂、听懂,比
语言障碍辅助计画 Euphonia

Google 虽然推出一连串语音操控功能,但世上仍有不少说话有困难者,现场展示了让中风者语音训练 AI,经过训练他人模糊难以辨识的语句也能为 AI 辨认,甚至不用完整语句只要发出不同声响、移动眼球就能达成特定操控。

Google 也邀请语言障碍者加入 Euphonia 计画,来让这类辨识能更加準确。

对于不方便接听与答覆电话者,也可以透过语音助理直接将对话转变成文字显示,并以语音助理回话。

另外还有个亮点:即时字幕。现在 YouTube 影片已经可以在手机端自动即时生成英语字幕,接下来在 Android Q 将可以即时帮各种影片上字幕,包括自己拍的相簿影片、其他网站上的影片,可以帮助听力障碍或者在不方便开启声音的状态下更舒适地观看影片。


相关阅读