至少从柏(bǎi)拉图(tú)这样的探究者时(shí)代开始,什么东西会(huì)让人感到好笑(xiào),这一问(wèn)题一直(zhí)让(ràng)哲学家和科学家(jiā)感(gǎn)到困(kùn)惑。希腊人认为,以他人(rén)为代价的优越(yuè)感是幽默(mò)的(de)来源。德国心理学家(jiā)西(xī)格蒙德-弗洛伊德(Sigmund Freud)认(rèn)为(wéi)幽默是一种发泄压抑能(néng)量的手段。为了让人们发(fā)笑,美(měi)国喜剧演(yǎn)员(yuán)罗宾-威廉姆斯挖掘了他对(duì)荒(huāng)诞事物的(de)愤怒。
对于"有什么好笑的?"这个问题的答案,似乎没有人(rén)能够达(dá)成一致。因(yīn)此,想(xiǎng)象一下试图训练一个机(jī)器人笑的场景。但通过创建一个从共享笑声系统中(zhōng)获取(qǔ)信号的人(rén)工智能(néng),日本京都大学的一个研究(jiū)小组正试图(tú)做到这一点。研究人员在(zài)《机器人(rén)学(xué)和(hé)人工智能前沿》杂志上描述了他们为日本机器人(rén)"Erica"创造笑这一(yī)表(biǎo)情的新技术。
这(zhè)并不(bú)是说机器人不能理解,甚(shèn)至(zhì)不能对(duì)一个糟糕的笑话发出笑声(shēng)。相(xiàng)反,困(kùn)难在于为(wéi)人(rén)工智能系统(tǒng)开发人类幽(yōu)默的(de)微妙(miào)之处(chù),以增强(qiáng)机(jī)器人和人类之间(jiān)的普(pǔ)通(tōng)对话。
研究(jiū)人(rén)员与Erica之(zhī)间(jiān)的对话实例(lì)。资料来源:Inoue等人
"我们认为对话式人工智能的重(chóng)要功能之(zhī)一是转移情感,"主要作者井上浩二博士解释说,他是京都大学信息学研究(jiū)生院智能科学和技术系的(de)助(zhù)理教授。"当然,对话是多模(mó)态的,不仅仅是正(zhèng)确(què)的回应。因此,我们决(jué)定,机器人能够与用户产生共鸣(míng)的一种方式是分(fèn)享他们的(de)笑声(shēng),而这(zhè)是(shì)基(jī)于文本(běn)的聊(liáo)天机(jī)器人无法做到的。"
在(zài)分享笑声的模式中,人类最初(chū)会笑,而人工智(zhì)能系(xì)统则以笑声(shēng)作为移情反应。这(zhè)种方法需(xū)要设计三个子系统--一个用于检测笑(xiào)声,第二(èr)个(gè)用于决定是(shì)否笑,第三个用于选(xuǎn)择适当(dāng)的笑声类型。
科(kē)学家们通(tōng)过注(zhù)释80多段来自速配(pèi)的对话来收(shōu)集(jí)训练数据,速(sù)配是一种社会(huì)场景,大群人在短暂(zàn)的时间内一对一地(dì)互(hù)动。在这(zhè)种(zhǒng)情况(kuàng)下,涉及京都大学学生(shēng)的"相亲马拉松"活动让Erica加入(rù)其中,由几个(gè)业余女(nǚ)演员(yuán)远程操作。
"我们(men)在这项工作中(zhōng)最大的挑战是确(què)定共享笑(xiào)声的(de)实际案例,这并不容易,因(yīn)为如你所知,大多数笑声实(shí)际(jì)上(shàng)根本没有共享(xiǎng),"Inoue说。"我(wǒ)们必须仔细分类,到底哪些笑声可以用于我(wǒ)们的分(fèn)析,而不是仅(jǐn)仅假设任何(hé)笑声都可(kě)以(yǐ)被回应。"
笑声的(de)类型也很重要,因为在(zài)某些(xiē)情况下,礼(lǐ)貌的笑声可能比响亮的(de)嗤(chī)笑(xiào)声更合适。实验仅限于社交性的笑(xiào)声与欢快的笑(xiào)声。
研究小组(zǔ)最终通过在一个人和Erica之间(jiān)用她的新(xīn)分享式笑声系统(tǒng)创造四段(duàn)两到三分钟的(de)简短对话来测试Erica新学会的幽默感。在(zài)第一个场景中,她只发出了社交性的笑声,随后在第二和第三个交流中只(zhī)发出了欢笑声,在最后一个(gè)对话中两种笑声结合(hé)起来。该小组还创建了另外两组类似的对话作为基线模型。在第一组中,Erica从(cóng)未笑过。在第二个中,Erica每次检测到人类的笑声时都会发出社交性的笑(xiào)声(shēng),而不使(shǐ)用其他两个子系统来(lái)过滤背(bèi)景和反应。
研(yán)究人(rén)员共召(zhào)集了130多人听取了三种不同条件(jiàn)下的(de)每个场景--共享笑(xiào)声系统(tǒng)、无笑声(shēng)、所(suǒ)有笑(xiào)声--并根(gēn)据移情、自然、人类相(xiàng)似性和理解来评估互动。共享笑声系统的表(biǎo)现优(yōu)于(yú)任何一种基线(xiàn)。
"这篇论文最重(chóng)要的结(jié)果是(shì),我们已经展示(shì)了我们如何将所有这三项任务结合到一个机器人中。我(wǒ)们相(xiàng)信(xìn),这种类型(xíng)的组合系统(tǒng)对于正确(què)的笑的行为是(shì)必要(yào)的,而不仅仅是检测到笑并对其(qí)做出反应,"Inoue说。
在(zài)Erica准备好参加脱口秀表演之(zhī)前(qián),还有很多其他的笑声方式需要建模和训练。"还有许(xǔ)多其他的笑的功能和(hé)类(lèi)型需要考虑(lǜ),这不(bú)是一项容易的任务。我们甚至(zhì)还(hái)没有(yǒu)尝试对不共享的(de)笑声进行建模,尽(jìn)管它们是最(zuì)常见的(de),"Inoue指出。
当(dāng)然,笑声只是与机器人(rén)进行类似人类自(zì)然(rán)对话的(de)一个方面。
"机器(qì)人实际上(shàng)应该有一个独特(tè)的性格(gé),我们(men)认为(wéi)他们(men)可以通过他们的对话(huà)行为来显(xiǎn)示这一(yī)点(diǎn),例如笑、眼睛注视、手势和说话风格(gé),"Inoue补充说。"我们认(rèn)为这根本不是一(yī)个简(jiǎn)单(dān)的问题,很可(kě)能需要10到(dào)20年(nián)以上(shàng)的时间,我(wǒ)们才能最终与机器人像与朋友一样进行休(xiū)闲聊(liáo)天(tiān)。"