在今年上映的科幻电影《降临》(Arrival)
中,“七肢桶”外星人通过圆形的文字和地球人交流,女主角语言学博士露易丝解构这种文字,领悟了一种能够忽略时间的能力,学会了预知未来。
我的同事盛威曾指出,支撑这一逻辑的理论主要是在语言学颇受争议的“语言相对论”(Linguistic
relativity),也叫“萨丕尔-沃夫假说” (Sapir–Whorf
Hypothesis)。它只是一个基于观察和并不缜密的逻辑论证而提出的假说,未经证实,但它做了两件重要的事:
1)让文科生在科幻电影里有了立足之地……
2)提出了一个非常重要的观点:人类的思考模式受其使用语言的影响,使用不同语言的人会对同一概念有不同的理解看法。
尽管在语言学界,萨丕尔-沃夫假说仍未得到证实,它的部分设想却备受另一个领域研究者的推崇。这个领域就是人工智能。
微软全球执行副总裁沈向洋
20
多年加入公司,今年刚获选成为美国工程院院士。他在研究上的方向主要是计算机视觉,是这个方向的世界级专家,但最近几年,他开始更多关注人工智能领域的另一个方向:自然语言。
这是因为现在的人工智能研究和应用高度发达,却离通用人工智能
(General AI),还差的太远。在沈向洋看来,最强大的人工智能还不如一个四五岁的孩子。
沈向洋接受
PingWest品玩专访
强大的人工智能系统,比如
AlphaGo,仍需要巨量的棋局、棋谱数据以及运算才能够成为现在的样子。AlphaGo
不止可以下围棋,对一些其他游戏(比如红白机游戏或星际争霸)也很擅长,但它仍然不是一个通用的人工智能。本质上,人们对通用人工智能的期待其实就是它像个人类那样思考和做事,它下围棋可以不用很厉害,只要能跟业余选手来一场就可以了。在现实中,绝大多数人更期待发生的,是一个系统能够比较靠谱地解决所有问题,或者至少能够解决大多数、最常见的问题,而非在某个特定场景下表现异于常人。
一个婴孩,为什么他哭过几次就能很快明白,哭了之后妈妈就会来照顾他?或者莱特兄弟以及人类航空的先驱者们,他们造出的固定翼飞机和扇动翅膀的鸟完全不同,如果人类想要飞翔,单纯模仿鸟类的话,造出的飞机恐怕不是现在的样子……快速学习和解决问题,以及举一反三、随机应变等这些能力……目前的人工智能都无法做到。
而沈向洋倾向于认为,人类作为一个生物种群在通用智能上优异的表现,可能和我们所使用的语言有关。在实现通用人工智能的路径上,必有自然语言。
要解释清楚他的看法,并不难。我们先来看一张图,来自
Hackernoon:
这是一座人工智能的金字塔,最下层的是机器学习,早在上世纪
80、90 年代就已实现,最近几年来广泛应用在各行各业应用,比如苹果的 Siri、微软的小娜
(Cortana),或者今日头条基于算法的内容推荐;第二层是机器智能,使用更复杂的机器学习算法,让计算机能够处理一些更复杂的任务,比如使用深度神经网络训练的
AlphaGo 能够击败世界排名前列的职业围棋棋手。
第三层叫做机器意识,解释为计算机能够从经验中进行自学,自己获取新的知识,而不需要研究人员或者用户提供更多的外部数据喂给它。需要明确的是达到了第三层的人工智能仍然不是通用人工智能,但它已经具有了基本的意识,就像已经上完小学的少年一样,他获得了一定的学习能力,并且明白还有更多自己没有学到的知识和能力。
自然语言之于人工智能的重要性,并不仅仅体现在取代我们记者和编辑的职业,以及写诗上——显然,人类从数千甚至上万年前所积累到今天的知识,绝大部分是以文字的形式,被保存在史书、技术丛书、论文、Twitter、Facebook、微博和网站里。
在沈向洋看来,文字和语言是人类至今最伟大的发明:
我们都看过《人类简史》、《未来简史》,我看过很多遍,思考为什么人类脱颖而出,变成了主宰地球的群体?到底发生了什么事情,我们获得了什么能力?
实际上,原因是我们发明了语言,进而产生了非常了不起的事情。通过语言,我们可以组织,成立公司、宗教甚至国家……语言的力量非常了不起。
而想要让计算机理解人类,发展出通用人工智能,最重要的毫无疑问是让它掌握一种方式,能够高效地吸收和利用人类的知识。
语言对于人类智能发展的重要性不仅体现在知识上,还有情感。知识是理性的,情感是感性的,但它们都可以通过语言呈现。一句话不同的遣词造句方式都可以表达同一种意思,但表达的效果却能有很大不同。
我们憧憬人工智能是希望它成为一个人类的伴侣,能为人类所用,而作为理性和感性兼具的高等物种,我们自然也会期待人工智能具有一定的感性,就像科幻电影《她》(She)
里的萨曼莎以及千千万万个 OS1
人工智能操作系统,甚至具有让爱人和让人爱上的能力。巧合的是,萨曼莎并没有一个视觉交互界面,她和西奥多的交流完全通过语音对话发生,能够听懂西奥多的情绪,甚至西奥多不说话萨曼莎也能体会出他的感伤……二“人”从未真正见面,却可以发展出难以割舍的情愫。
综上,吸收人类的知识、理解人类的情感,在理性和感性两个方向上同步前进,都对自然语言处理技术提出了很高要求。这也是为什么沈向洋认为自然语言可能成为打开通用人工智能这扇大门的钥匙。
他负责的微软人工智能部门,正投入很大的科研和研发力量尝试让计算机掌握更好的自然语言处理能力。该公司推出过一套包含视觉、语音、知识图谱、搜索方向的人工智能
API,叫做“认知服务” (Cognitive Services),其中一个技术名叫语言理解智能服务 (Language Understanding
Intelligent Service, LUIS)。
LUIS
想要实现的就是,“你讲一句话,机器可以拆解你这句话,动词和名词,”沈向洋说。这样,机器可以通过一轮或者多轮对话来理解用户语句的上下文背景、说话的心情和意图,进而机器可以用用户熟悉的说话方式来交流。LUIS
技术可以被用来开发更具有亲和力的聊天机器人。
以聊天机器人小冰为例,尽管它只会聊天打屁,偶尔唱歌,还能写诗,倒是做不了什么正事,微软仍对它非常满意。因为它取得了一个其他智能语音助理和聊天机器人难以取得的成就,在平均对话轮数
(conversations per session, CPS) 这个指标上达到了 23,远超 Siri、Alexa 甚至自家的小娜。
通过越来越多的聊天机器人对话,微软希望能够训练出一个基于对话的人工智能系统
(Conversational AI)。沈向洋再次明确,微软已经决定用对话的路径去实现通用人工智能,而理由正如前述,因为语言无比重要。
在电影《降临》中,虚构的外星人种族所使用的语言中没有时间的概念,这使得它们能够在新的维度审视时间,而当女主角学会这种语言后,成功预知了未来并免除了两个星球注定灭亡的命运。
在现实中,我们不用为了活命必须学会新的语言,但在未来,我们创造出的究竟是一个能够理解人类,具备自学能力的通用人工智能,还是一个无法对人类产生同情,极度理性和自私的杀手人工智能,关键可能也在语言上。