AI探索价值,小冰一点都不逊那条狗

AI探索价值,小冰一点都不逊那条狗

微软小冰诞生后,其实有很多出彩的表现。可惜,当它去年想发力的时候,一下被阿尔法狗抢去风头。人工智能快专职下棋了哈哈。

不过小冰最近推出了自己的诗歌集,你能体会到它对自然语言的突破。我个人认为,虽然与阿尔法狗不是一个维度,但小冰在自己领域的进展,不逊于阿尔法狗在自己领域的取得的成就。

AI探索价值,小冰一点都不逊那条狗

阿尔法狗的牛逼在于强大的算法、机器深度的自我学习。看到一些分析者的观点,说它甚至还有强大的图像识别因素在里面。我不懂技术,只能理解一点。

小冰诞生时,就是个比较粗糙的语言机器人。微软为了提高传播力,甚至后来还故意让她说粗话骂人。

之后它还被微信给封杀了。你明白,小冰当初的自然语言语料来自MSN等通路,据说当年是1500万条语料。但是,当年的MSN,相比这几年的微信,对于语言的积累,肯定是小巫见大巫。微信封它,有内在的商业逻辑。

我也一直认为,腾讯的人工智能,虽然目前体现在什么绝艺等围棋项目上,其实,它的自然语言领域,才是更大的积淀。围棋更多是靠算法、计算、机器自我学习,当然有很多的技术,我也不懂,每天耗费的成本很高,投资很大。而且,马化腾说,就算绝艺改动一点点,整个学习过程都要重来。但是,自然语言的实践,我认为才是未来人工智能真正走向普及的革命。

依据我自己从事过语言研究(语音与语义)的感受,虽然粗糙之极,远不够专业,但我一直以来的直觉,就是这个领域的革命。过去几年,有些人说语音识别已经到了成熟阶段,我觉得这种观点极为可笑,语言就是思维的一部分外化,目前的语音识别都是很初级的应用。

语言的革命,未来会发生在语音层面。目前更多是音素层面的进步,借助它,我们可以确定一些发音规律、音标,涉及拼读的标准与规则,能够识别普通话与有限的方言。百度已经有不错的进展。但在我看来,识别几种方言的发言,也是相当粗浅的阶段。如果人工智能没有在音位层面诞生核心的技术,是不会有什么未来的。它至少无法驾驭不同的民族。

这个跟高级口译不是一个问题。机器听到老外说话,很快翻译出来,跟底层的语音革命不是一个问题。

所以,相比炒作不停的阿尔法狗,我反而更看重微软小冰的探索。它以中国近代、现当代诸多诗人的作品为大数据,形成了自己的学习世界。虽然语料库远不够大,但已经是非常有意识的探索了。从她“写”的一些诗看,她对语言表达的创新,对于汉语语义的探索,当然也包括词汇的偶然碰撞,非常有价值。

有一段时间,我对汉语的出路一直怀有深深的悲观。我知道自己一夜醒来绝对不可能说不出汉语词汇,说不出句子,发不出声音。但多年来,我确实意识到,汉语创新的出路越来越窄。

一是语音层面,古今演变,遵循着经济、省力原则,汉语许多发音已经失去了过往许多隐秘的社会特征。当代音韵学里,失去了古汉语里非常复杂、精致的一面。当然,我们不能强迫民众回到茹毛饮血的远古,去发出那种更多是本能的声音,那是自我贬抑,矮化人类的进化。

语音的简洁、经济、省力,为词汇、结构以及整个语言的社会性释放了活力。它们是一体的世界。

不过,汉语词汇的生成,实在已经接近停滞。每年都有人编撰一些新词词典。互联网时代,每年也有一些流行语。但是,整体来说,进入主流表达已经极为困难。

本来,方言的世界,是可以源源不断为普通话贡献新词。但是这是一个悖论。普通话世界的拓展,恰恰是以方言弱化乃至消失为代价。偌大中国的复兴与崛起,是以牺牲语言的多样性为代价的。

你可以意识不到,每一年,每一天,甚至每一刻,在中国这辽阔的土地上,有多少方言、民族语的词汇与表达永远消失。它也是文化多样性的消失。

所以,前段时间,跟几个朋友聊天,说到一个音乐人下到中国民间,去录那些民族方言,以保留语言世界。很感动,但也觉得最终意义也不会大。因为,我知道,只要不活在民众的口头上,任何录下来的语言,它只有一部分学术的生命力,而没有真正的文化滋养力。

当然,整个地球快成大村庄了,人类民族语之间的碰撞还会产生一些新的洋泾浜,会有新的语言形式与种种表达,但这个过程远不如内部姻缘更近的语言之间,更有文化的塑造力。普通民众也不会有真正的感受,虽然他们的生活确实正被语言的世界所改变。

语法的改变更难。不说了。

接着说微软小冰。它的价值,不在于做做诗,我刚才说了,它是人工智能对于汉语言的深层实践,能让我们看到,我们的语言其实隐含着伟大的力量。它不是我们日常生活里如此庸俗的一面。我说庸俗,绝对不是贬义,而是说,我们的日常生活表达,更多是有限的,非完句的时候多,整个语言的世界,我们的表达会越来越单调,尤其是普通话的世界。

记得两年前,官方媒体讨论过汉语的纯洁性。除了一些脏话之外,还批判了洋泾浜。我觉得这种批判扭曲了语言的演进。深层的矛盾不在于汉语里夹杂着多少英语或者其他外语词汇,而在于,我们辽阔大地上,语言的多样性在快速消失。我尊重普通话,但我觉得,语言的推广还有我们的教育,不能建立在方言、民族语言消失的基础上,反而应该强化方言与民族语言的生命力。

当然,这种呼吁是徒劳的。一个偌大国家,如此辽阔的土地,如此庞大的人口,遵从意识形态的管理,有利于稳定。只要稳定是一种取向,统一的秩序、追求效率一定是最强的诉求,它必定带有粗暴的特征,从而导致一切都不太可逆。

小冰虽然是机器,但它可以激活语言的实践。未来,如果机器能在日常生活中扮演更多方言、民族语言的力量,也许能够拯救正在消失的世界。虽然我觉得它最终也会是徒劳的。因为机器的世界,它对语言的实践,还是更多停留在普通话的世界。

不过,我仍对小冰在诗歌领域的探索怀有一丝兴奋。

于是,再度贴上傍晚写的一段。

“诗是本我,散文是自我,小说是超我。

写诗,表面看,是人工智能对语言的实践最简单的一面。因为语义本就模糊,一般读者没有什么统一的评判标准。

实际上不是。。很多新诗虽然不像旧体诗对词汇、节奏尤其韵律要求高,相对自由,但仍有内在的节奏感。。它对声音、色彩的识别,要比其他文体复杂。。

闻一多先生说,诗有三美,建筑美,音乐美,绘画美。建筑美侧重形式,机器肯定没问题,绘画美侧重色彩,属于修辞的世界。。音乐属于声音与节奏的世界,与内在的情感关联更紧,这个对机器的挑战很高。

当然机器写出来诗,跟阿尔法狗战胜李世石不一样,后者是有胜负。而读者欣赏诗不是这种胜负的博弈,它是一种多维的参与、填充,共同扩充意义的空间。当然读者赏析能力有差异,也有可能损耗原作的价值。。不过想到它毕竟是个机器,诗歌里的智慧,或者纯粹语言的机智,充满更多偶然。。

马拉美没活到现在,可惜。。多希望他能看到这一幕。。。他在诗歌里的语言实践已经算吓人了。

AI探索价值,小冰一点都不逊那条狗

AI探索价值,小冰一点都不逊那条狗

AI探索价值,小冰一点都不逊那条狗

AI探索价值,小冰一点都不逊那条狗

AI探索价值,小冰一点都不逊那条狗

AI探索价值,小冰一点都不逊那条狗

另外有些诗还有固定的格式。这个对机器来说当然不是难点。

不过,若是写出相当篇幅的小说,让大众读者而不是有更多赏析能力的人去评判,对自然语言会有更真实的体会。长篇小说需要有更广更深的时代内容,机器这方面的驾驭,要么太露骨要么太隐晦,真的难以想象它的边界了。。

好可怕。。未来的诺贝尔文学奖获得者,可能就是机器了。”

最后,我想说,人工智能领域,阿尔法狗的路径只是非常狭隘的一面,虽然我知道它是必需的一步。但我要说,若要真正实现更大的变革,语言尤其是语音层面才更具有颠覆的价值,商业领域当然也是如此。小冰以及同类领域的探索,一点不逊于阿尔法狗们。

我仍坚持,微观领域,人工智能的伟大革命,就在未来几十年的语音革命里。尽管我十分悲观,但是考虑到中国多民族特征,相比其他许多国家,语言至今仍还是多样的。它促成的线下世界,比我们这些人竟然谈论的所谓线上商业生态要更复杂,也更有价值的多。它才是我们这个社会发展的隐秘力量。

未来,我要说,除了线下生态、连接,还要看语言决定的文化多样性。谁能维持、发展得更充分,不那么单调,这个国家会更有竞争力。

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin
avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: