海洋之神HY590
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • 智慧园区解决方案

    2026-05-03 15:16

    传统园区长期面临“服务体验不完善、园区整体安防弱、管理成本高且运营效率低、业务难以创新”等多重痛点,为用户提供创新性的用户体验与更美好的服务感知,助力企业通过数字化转型实现创新发展正是“智慧

  • 未来工业互联网怎样加速“落地”?

    2026-05-01 14:41

    工业互联网领域“新政”和相关研究成果频频出炉:工信部近日发布《关于推动工业互联网加快发展的通知》业内人士称,当互联网进入下半场,工业互联网与5G、网站设计大数据中心、人工智能等,一并构成了未

  • 医院网站建设方案

    2026-04-27 07:55

    医院通过在网上建立一个网站,既可以向外介绍医院的基本医疗特色和相关服务,宣传医院的科室、专家、树立其良好的医院形象,宣传推广医院开展的新技术、新项目、动态地发布医疗、科研等新颖信息、展示技术

  • 疫情下资本加仓互联网企业的真正目的?

    2026-04-26 22:28

    在新冠肺炎疫情对全球经济都带来直接影响的背景下,不少行业都受到了严重的影响,对于资本市场而言更是引发了不小的担忧。但是相对于全球市场而言,中国的社会经济发展显然更加坚实和具有活力,也成了在疫

  • 海洋之神HY590小编浅谈自适应网站设计的几点要素

    2026-04-25 13:13

    随着科技的发展进步,移动端设计成为必不可少的一个宣传渠道。那就不得不提到自适应网站开发设计,它就是让一个北京网站设计可以在不同的设备上都能让客户很好体验。对于一些简单的网站来说这不太难,但是

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-04-24 23:15
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。