银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版



    咨(zī)询热线:021-80392549

    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版 QQ在线 银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版 企(qǐ)业微信
    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版
    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版 资(zī)讯 > 人工智能 > 正文

    嘘!AI正在悄悄听懂(dǒng)你说的话

    2019/02/12机器人463

    小(xiǎo)时候看特务(wù)电影时,特工们(men)往往有(yǒu)一(yī)项必备的技能,就是隔着几百米远盯着正在(zài)说(shuō)话的对(duì)象,从嘴型判断出对(duì)方在说什(shí)么。有了这种记忆,导(dǎo)致如今看什么语(yǔ)音识别技术(shù)都觉得相当一般——我都说(shuō)出声儿了你才听懂,算(suàn)什么AI好汉(hàn)。

    不过最(zuì)近一项专利申请表(biǎo)明,微(wēi)软正在向特工学习,推出了无声语音识别技术。当AI也能(néng)像特工一样,无声之中(zhōng)辩人言,我们的世界究(jiū)竟会有(yǒu)什么(me)不同?

    除去唇语(yǔ)识别,AI还有什么方式悄(qiāo)悄听懂你的(de)话?

    说起无声语音识别,可能很多(duō)人第(dì)一反应就是复制人(rén)类(lèi)的方式,利用图(tú)像识别进行辩(biàn)读唇语。而利用唇(chún)语进行语音识别这种方式也由来(lái)已(yǐ)久(jiǔ),但(dàn)是识别的准确率一直不算高。DeepMind曾在2016年做过测试,经过1万小时(shí)的新闻视频训练(liàn),AI唇(chún)语(yǔ)准确率(lǜ)达到了46.8%。国内有一家企业曾经提(tí)供(gòng)过(guò)相关数据:在对中文新(xīn)闻视频的(de)识别中,准确率(lǜ)达到了70%。而搜狗所推(tuī)出的(de)驾驶场景下(xià)的唇语识别,因(yīn)为涉及到的词(cí)汇量很(hěn)少,准确率能够达(dá)到90%。

    可以发现,相(xiàng)比现在(zài)主流语(yǔ)音识别动辄95%、97%的准确(què)率,唇语(yǔ)识别准确程度(dù)实(shí)在是有(yǒu)些拿不上(shàng)台面。对于中文这种(zhǒng)一字一音节的语(yǔ)言来说还好,对于英文这种连音很多的语言来说,唇(chún)语识别要跨越的门槛确实不小(xiǎo)。

    另一方面来(lái)看,唇语识别所涉及(jí)到伦理问题(tí)实在过于(yú)严(yán)重。唇语识别的“射程”太远,如果这种技术真的发展(zhǎn)成(chéng)熟,意味着天网之下的我们在交谈(tán)时将(jiāng)再(zài)无隐私。在隐私焦虑越来越浓的今天(tiān),哪家(jiā)企业(yè)公开研究这项技术(shù),只(zhī)怕是觉得自己家的(de)公关部(bù)门过得太清闲。

    因此包括微软在内的产业(yè)和(hé)学(xué)界,都在寻找一种更精(jīng)准也更(gèng)隐(yǐn)私的(de)无(wú)声语言(yán)识别(bié)。目前看来,无声(shēng)语音识别的技术方(fāng)向(xiàng)可(kě)以被(bèi)分为两(liǎng)个“派系”,一是(shì)“气宗”,另一个(gè)是“电宗”。

    微(wēi)软所提交(jiāo)的(de)专利,就是典型(xíng)的“气宗”——在终端上添加传感器,通过感知(zhī)用户(hù)说话时的气(qì)流来判断(duàn)用户说(shuō)话(huà)的内容。这种终端如同一只小型麦克风,置(zhì)于用户嘴边,用(yòng)户在说话时形成的气流会在设(shè)备中形(xíng)成反射,经过训练,可以将这些气流反射的信号和文(wén)字一一对应。

    而“电(diàn)宗”则(zé)更加神奇,我们知道人在说话(huà)时需要调动整(zhěng)个(gè)下半(bàn)张脸(liǎn)的肌肉,不同(tóng)的文字发音所调(diào)动肌肉的方式(shì)也并(bìng)不相(xiàng)同。通过对面(miàn)部EMG(肌电)信号的采集,来学习人(rén)类说(shuō)话时面(miàn)部EMG信号特征,并通过神经(jīng)网络的训练(liàn)将EMG信号和文字对应(yīng)起(qǐ)来。

    可(kě)以看出这两种无声语(yǔ)音识别(bié)都有一个共同的特点,那就是自主性(xìng)和私密性。不管是EMG信(xìn)号采集还是(shì)气流采(cǎi)集,都需要在(zài)讲话(huà)者身上佩戴好设备,而不是像图(tú)像(xiàng)技术(shù)一样,能够(gòu)在远程且讲话者(zhě)不知情(qíng)的情况(kuàng)下进行采集分析。

    无声语音(yīn)识(shí)别变成(chéng)真·气功?

    不论是气宗(zōng)还是电宗(zōng),这(zhè)些无声语音识别技术都面临着同样的问题——既然要用(yòng)户把话说(shuō)出来才能进行识别,那为(wéi)什么不(bú)直接(jiē)应用语音识别(bié)来进行(háng)文字(zì)转换和翻译,非要弄(nòng)一些和“气功”一(yī)样没有切实应(yīng)用场景的花招?

    其实无声语音识别的(de)应用,可能(néng)不像大家想象的那样广(guǎng)泛,它既不能以最高效的(de)方式帮助(zhù)听障人士(shì),也(yě)不允许(xǔ)被应用于监听等等工作。但在一(yī)些(xiē)关(guān)键场合下,无声语音识别却可以发挥(huī)出奇用(yòng)。

    我(wǒ)们可以一起开动脑筋(jīn),想(xiǎng)想在哪里(lǐ)人(rén)们需要说话,但(dàn)却听(tīng)不到彼此(cǐ)的(de)声音。答案很简单,要么(me)是(shì)在声音无法传播(bō)的地(dì)方,要么是在一些特别嘈杂的地方。于是(shì)无声语音识别(bié)就有了如下的应用场景:灾害现场、舱外探(tàn)索、水(shuǐ)下作业……

    在这类场所中(zhōng),人们或许为了躲(duǒ)避被污染的空气(qì)、或(huò)许(xǔ)为了呼吸氧气(qì),都会穿上类似(sì)生(shēng)化服、宇航员服等等(děng)特殊服装。穿(chuān)上之后(hòu)既看不到对方的表情,也听不到对方的声(shēng)音,更(gèng)没(méi)办法(fǎ)用语音交互去控(kòng)制其他(tā)设备了。同时环境情况(例如氧气不够(gòu)充足)往(wǎng)往(wǎng)不允许人们以(yǐ)正常的声音说话(huà),加上防护服(fú)的封闭状况会引起声音(yīn)的回响,以往的有(yǒu)声语音识别在这种情况下很(hěn)难发挥(huī)作用。

    这时(shí)可以被(bèi)安置在防护服内部的无声语(yǔ)音识别就显得很有价(jià)值,讲话者只(zhī)需要(yào)做出口型就能向外(wài)界传递信息。

    除此之外还有嘈杂的马路(lù)、工厂车间(jiān)、机场……

    在这(zhè)些场所中,想要让(ràng)对方听清自己的声(shēng)音,往往(wǎng)需要扯着嗓(sǎng)子吼(hǒu)。想让(ràng)语音识别(bié)准确拾音(yīn),更(gèng)是难上加难(nán)。这时利用无(wú)声语音识别就会轻(qīng)松很多,不仅可以准(zhǔn)确表(biǎo)达信(xìn)息,也能让一些处于这种场合的工(gōng)作人员戴(dài)上隔音耳塞保护(hù)自(zì)己的听力。

    实(shí)际上目前在欧洲一些型号的(de)战(zhàn)斗机中,就因为机舱(cāng)内噪音巨(jù)大、飞行(háng)员之间无法沟通,已经应用上了(le)EMG信号(hào)无声语音识别技术。

    当(dāng)然,目前(qián)相比语音识别技(jì)术、甚至相比唇语语音识别,无声语音(yīn)识别技术(shù)的发展阶段还很初(chū)级,应(yīng)用(yòng)效率也(yě)不高。

    实(shí)际上(shàng)无声语音识别是一项(xiàng)典型(xíng)的“美好而无(wú)用”的AI技术,它既完美体(tǐ)现(xiàn)了一系列技术的排(pái)列组合,例(lì)如(rú)EMG信号无(wú)声语音识别所体现出的AI与神经学的结合(hé);又在应用上极大程度的受限,即使在一些声音难以传播的场景下,也(yě)要考虑计(jì)算条件、识别(bié)语音后(hòu)信息再传递的媒介,更不用提复杂的数据收集工作了。

    但我们有(yǒu)理由相信,在未来(lái)AI技术越来(lái)越普(pǔ)及化、应用成本越来越(yuè)低时(shí),总会出现一(yī)些(xiē)极(jí)端场景应用上这些看似无用(yòng)的(de)技术——也许未来有(yǒu)一天,战斗(dòu)机的控制也要应用上语音(yīn)交互呢?

    关键词: 人工智能 机(jī)器人




    AI人(rén)工智(zhì)能(néng)网声明(míng):

    凡资讯来源(yuán)注(zhù)明为(wéi)其他媒体来源的(de)信息,均为(wéi)转载自(zì)其(qí)他媒(méi)体,并不代表本网站赞同(tóng)其(qí)观点(diǎn),也不代表本(běn)网(wǎng)站对其真实性负责。您若(ruò)对该文章内(nèi)容(róng)有任何疑问或(huò)质疑,请立即与网站(www.chaoyang.maanshan.liaocheng.jixi.ww38.viennacitytours.com)联系,本网站将迅速给(gěi)您回应并做处(chù)理(lǐ)。


    联系电话:021-31666777   新闻、技术文(wén)章投稿QQ:3267146135   投稿(gǎo)邮箱(xiāng):syy@gongboshi.com

    精选资讯更多

    相关资讯(xùn)更(gèng)多

    热门搜索

    工(gōng)博士人工智能(néng)网
    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版
    扫描二维码关注(zhù)微信
    扫码反馈

    扫一扫,反馈当前页面(miàn)

    咨询反馈
    扫码关注

    微信(xìn)公众号

    返回(huí)顶部

    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版

    银河游戏平台app(官方网站) - APP下载IOS/安卓/全站通用版