人工智能井喷式发展 电视厂商扎堆发布“智能语音” - {$web_name} 还有一种说法叫做AI

来源:一时千载网 | 栏目:知识 | 2026-06-15 05:30:38
  导读:2017年电视圈子又火了另外一个东西——智能语音技术,还有一种说法叫做AI,说的朴素一点就是电视上的语音交互。
 
  随着VR/AR这股热潮逐步冷却之后,2017年电视圈子又火了另外一个东西——智能语音技术,还有一种说法叫做AI,电影预告:适合发朋友圈说的朴素一点就是电视上的语音交互。尽管不是什么新鲜的概念,可是最近所有电视品牌方的每一场春季亮相会,差不多都在着重的强调自家电视的智能语音技术,似巧合,又非巧合。智能语音技术为何在这个时间点在智能电视上井喷?值得我们为此研究一番。
 
 
  智能语音的风口真来了?

  投资界流行这样一句话:投资要投“第三眼美女”,第一眼、第二眼美女交往的门槛和成本都较为高,而只有第三眼美女是归于大众的,对应到商品上,近日2025双11预售,背后原因值得深思就是任何技术商品都要到第三代才能被大众广泛接纳,才能长时间的存在下去。


 
  AI技术从50年代的控制论与早期神经联网,走到如今的AlphaGo、Master,如今正好在历程技术进展的第三个阶段。50年代末是一波高潮很多死掉了,到70年代的时候全国自然科学基金会都不扶持了。80-90年代又活跃了一次,但许多认知科学家强烈抵制当时很火的一个AI概念“物理符号操控系统假设”,觉得身体是推理的必要条件,加上科研经费的削减,又死了。今日正好是第三波,理论上机遇较为大。

  第三代技术应该足够下方到消费领域,接下来我们看看各电视品牌方智能语音技术具体的年初回顾手机摄影,看完瞬间懂了使用状况如何。


 
  TCL:亮相会上TCL着重演示了AI助手“小T”,具备感知、认知、办事、进修的三大特性。而“小T”是TCL集团与腾讯、阿里在AI及云办事上开展资料打通,做到资源共享的结晶。

  长虹:启动以电视机为中心的AI渠道AI Center。据悉长虹除了与IBM、科大讯飞等达成兴办,也与杜比、腾讯、华帝,以及清华大学、西安交大、微软、详细Switch评论中科院等结成“AI产业联盟”。

  微鲸:微鲸技术启动了微鲸智能语音电视2.0高端商品醉薄A系列,并亮相微鲸全线商品也将进入2.0时代。其与科大讯飞与美国麻省理工传媒评测室、微软等,分别在语音遥控、多传媒交互领域、人脸确认等方面达成了兴办。

  乐视:从乐视一代超级电视着手就搭载有语音特性,超级电视语音技术历程从兴办到自主开发的过程,乐视的超级语音技术,不只含有语音确认和语义确认,其自主开发的语音合成TTS技术已完整启动。  


 
  差不多每一个品牌方都在强调对语音认知已从特性层面上升到AI。并且背后还有巨大的兴办团队,与知名的语音技术和AI渠道密切兴办和开发。这种全军出击的局面,很难否定智能语音在电视行业的进展盛况。但盛况并不意味着技术和商业的足够成熟。

  语音确认究竟有多难?

  为什么智能语音技术进展了这么长时间,还是做不到对语音和语意的精准确认呢?我们有必要先知晓一下语音确认是怎么做到的。

 
  声音实际上是一种波纹,就像自然中的光谱一样。假如要对声音开展确认,就要先把声音的这种波纹切分成很很多小片段,就好比一个影像由很多帧画面构成,画面又由很多个分辨率点构成一样,语音也可以切分成很多帧。所以语音确认的大约流程可以归纳为以下几点:

  采集:声波信息分段采集

  编码:把每一单位长度的语音变成多维向量(信息信息)

  训练:从资料中进修对语音的判断,而不是用人工的规则。 用资料库和兴办模型让语音操控系统自我进修(假如遇到方言,需要兴办独立的一套操控系统)

  解码:用训练好的模型组合起来就可以经由判断新的语音向量,来确认语音了。

  反馈:将确认结局经由设备播放出来。


 
  看似很简易的一个过程,实际上每一个环节都有很多难点,有很多不可控的因素存在。一方面是繁琐条件下,确认率显著下降,比如地方方言、背景噪音,还有说话语速的差异,都是不具规律性的;另一方面是语音的训练和评测用资料的并非完全匹配,假如用人民广播电台的语音来训练资料库,那实际操控中哪有这么多广播员呢?

  这些都还只是皮毛,最重大的是AI针对语意的理解才是巨大的艰难。就算身为人类,在没有前后文的状况下,忽然扔给你一段话,你也不见得能理解它的意思。而AI就更是一脸懵逼了,各异的麦克风、噪音、口音以及谈话信息下,AI作出的反应或许都截然各异,本质上它还不具备意识,对人类的语言缺乏足够的认知。 

 
  语音交互在电视上的实际操控过程中,还会遇到这样一个窘境:反应速度难题。试想一下假如对电视提出一个难题,哪怕回答的结局是精确的,但是等待时间却长达两三秒的话,你还有欲望持续对它说话吗?

  综上所述,不管是语音确认算力的亟待革命、语音工程上或缺的奇迹,或者是设备表现上的各类限制,智能语音进展到今日远远还谈不上轻车熟路。只可是正好它遇上了这个时代,能够忽略它的不成熟,容忍它的成熟过程。由于它已然进展的足够快了。

  除了足够智能,还需要什么?

  如今的智能语音并非完美,但是在电视这个渠道上,真的需要需要那么智能吗?

  电视的用途首要是什么?检索-点播-播控,无非就这是三点,深度整合一下在线和离线时的语音确认工具包,并及时升级,就能够基础满足使用者对此的需求。 
 
  但是假如把电视当做的AI控制中心,那电视就将会高频率的用起来。那对智能语音的请求就要高很多了。但是有一点身为智能电视的本质属性,是永远不会改变的。那就是给使用者提供足够多的信息和办事。

  假如电视没有足够多的模块和特性,没有足够多的信息和办事,使用者使用语言的动机就会缺失。假如没能打通所有家电智能渠道,没有统一控制协议,那使用者使用智能语音就会处处受限。


 
  真正要让使用者把智能语音特性使用起来,优秀的语音确认技术,仅仅是其中很小的一若干,在家人场景下的解决使用者实际难题的办事,才是根本。像很多品牌方在电视上加入的人脸确认、儿童教学,合作智能语音,才能发挥语音技术在这一场景下的价值。

  归纳:AI只有在不断交互的情形下,它才有使用的价值和提升的空间。所以在智能交互不断更迭的物联网时代,智能语音技术来得恰是时机。很多人把它看做是下一波风口,也并非无稽之谈。只可是,一切技术的价值都是围绕人性办事而形成,如何用智能语音连接所有家生命态下人性的需求,才是技术开发的另外,牌子制造商们迫切需要思考的难题。

上一篇:开放游戏《海贼王:世界寻求者》将登陆三大平台

下一篇:《恋与建制人》bai ?起逝世日庆典 以爱为翼天下风远

相关文章