25日,第十七届中国网络媒体论坛在呼和浩特举行。就“人工智能时代的媒体创新与发展”这一话题,光明网总裁、总编辑杨谷在论坛上作题为《汲取媒体融合力量创新主流宣传模式》的演讲。
光明网总裁、总编辑杨谷在第十七届中国网络媒体论坛上作主题演讲。
以下为演讲实录:
各位专家,各位网络媒体的同行,大家下午好,很高兴有机会跟大家分享一些不太成熟的关于人工智能的想法。人工智能像陈昌凤院长所说,去年成为一个全民所熟知的热词,现在可以说已经席卷了全球。从六七十年前人工智能这一概念诞生,到今天如此火爆,可以说是令我们这些互联网从业者非常欣慰的。
人类发明蒸汽机,是期待获得更多的力量来解放我们自己的肌肉和骨骼;人类发明飞机,是希望能够像小鸟一样自由地飞翔。而二十世纪最重要的发明----计算机,是希望有一台机器能够代替思考,使大脑获得解放和自由。机器代替人的思考,其终极追求就是人工智能。中国引进人工智能的概念大概是在上世纪八十年代,一批从美国回来的科学家,带回了人工智能的相关信息,其中一个人叫做渠川璐,当时就担任世界人工智能学会副会长,这是目前为止,中国人在人工智能领域中所担任的最高学术职位。正是这些人,开创了中国改革开放以后人工智能的研究。
刚才说,计算机就是为了解放人的大脑,代替人的思考,人工智能就是终极追求。现在看,这个预测早了一点,2014年,全世界才首次有人工智能系统通过了图灵机的验证,即能够模拟出3岁小孩的智力水平。而像AlphaGo这样划时代的产品,打败了李世石,打败了柯洁,可以说全世界没有人不服人工智能的。
人工智能是不是已经非常厉害了?实际上也还不是很厉害。从改革开放以后我国第一辈人工智能科学家,到今天许多致力于研究该领域的科技公司,关于人工智能的探索还有很大空间。
今天的人工智能跟过去相比,我们在三个方面取得了较大突破:
第一个是解决了没有海量的数据。过去,所谓的海量数据就是几个G的数据,现在的硬盘都是几个T,大了几千倍。
第二个是解决了无法海量的计算。过去的计算机计算能力很差,而今天我们通过云计算已经解决了大规模的并发计算这一方面。
还有一个很大的变化就是互联网。因为人工智能依赖于鲜活地数据输入,如果都是一些死的数据,系统会非常难用,用户体验不会好。现在有了互联网,几乎每一个传感器都可以当作人工智能系统输入语言。同时,互联网还极大地增强了人工智能的可用性,也就是说人工智能模拟出来的结果,能够通过互联网随时传达到每一位用户的手机上。
这三个方面的巨大突破----互联网、海量计算和海量数据的实现,我认为是使得人工智能从理论概念快速转向实际应用的重要原因。
至于新闻媒体行业,只是人工智能应用的一个领域,我们能做什么样的工作呢?光明网做了机器写作,也在尝试跟今日头条、微软搜索引擎、微软研究院做类似的合作。此外,我们尝试着做了一件与我们新闻同行都有关的事情:辨认采访对象。如每年的全国两会上,代表委员共约5000人,经常认不出来受访对象是谁。对此,我们尝试利用人工智能图像识别技术来解决这一问题。
今年两会期间,光明网推出了“小明AI两会”产品。我们把能够收集到的代表委员放到库里面来做一个标签,把他的名字标上,这项工作要人工来做,机器做不太放心,怕识别错了。然后我们把近四年所有的两会的报道输入到库中,约50万篇,并做了关联关系,把这些代表委员的照片跟他们相关的报道关联,然后再做一个数据库,在全国人大及全国政协的网站上将这些代表委员的个人资料数据下载下来。
最后我们使用微软的图像识别、人脸识别技术。当看到一位不认识的代表委员时,拿手机一拍,上传到系统中,系统就可以识别出这个人是谁。比如遇到雷军,可以拿手机拍摄,系统就会在库中进行匹配。
如果说把13亿人都输进去,估计现在机器还无法准确识别。现在人工智能还是会有很多局限性,但是识别这几千个代表委员还是可以的。有了第一步成功的识别,后面的工作就好做了。我们用了一些比较成熟的,跟人工智能沾一点边,严格意义上人工智能六度分割理论用到里面来,将与雷军相关的代表找出来,这些人可能都出现在同样的报道或者同样的相关的文章中,利用六度空间把这些代表委员和雷军的距离拉近。从50多万篇的稿件中找出雷军所关注的领域:关注中国制造,扶贫,慈善法。如果我不认识雷军,当我看到了眼前的这位代表委员,用手机拍了他,大致就能够了解他感兴趣话题,在提问环节问这些话题就好了。如果问一位代表委员与其毫不相关的问题,大家都会很尴尬。
“小明AI两会”是我们今年在两会期间推出的,引起了广泛关注。我们把人工智能领域的技术加到产品中。刚才讲的都是我们的用户在默默操作,没有涉及到人机交互,我们就把语音合成的技术加进去了,我们用的是科大迅飞在语音识别方面的技术。想了解哪个话题或者哪位委员代表的信息,直接用语音告诉系统就行了,可以输入自然语言,以后大家有兴趣可以做一些尝试。
代表委员的年龄、简历,在我们这个客户端里面都能够展示出来。既然能够显示出来了,有时候或者用户可能会不愿意用眼睛看,而是用耳朵听。我们将语音合成的功能加进去,把文字读出来。这样就形成了一个对我们采访两会比较有帮助的“小明AI两会”人工智能系统,这是人工智能在新闻报道行业里面一个小的应用。
大家推而广之想一想,它对有用,对于普通的网友有没有用呢?可能还是有点用,平时如果说用户在看一些报道或者电视节目时,对其中某些代表委员感兴趣,但是没有提供这方面的信息给用户,这时可以拿出客户端来扫一扫,把相关图像拍进去,就具备了现场同样的能力,可以了解到相关代表委员所关注的话题,跟他们有关系的人物,以及他们当时在做什么,这是利用人工智能现在已经在做的一件事情。
我们刚开始尝试,还有很多要改进的地方。在两会后,我们在5月份一带一路高峰论坛中沿用了这个技术。一带一路高峰论坛时,脸盲的问题更严峻了,很多老外没来过中国,你想认也认不出来,如果对方不说英文也不说中文,你甚至都没法和他沟通。这个时候拿出系统去扫扫人,看他是不是咱们想采访的对象,是就去采访,否则不浪费时间,在一带一路的时候我们的采访报道也用上了。
这两天我们就以这些为基础申报了北京市媒体融合重点实验室,我们的人工智能新闻信息服务实验室也成功入选。也欢迎同行们跟我们一起进行探索,看看在这个方面看还能够做一些什么。
刚才讲的是已经做的,最近做的是把语音合成这方面的技术进一步用起来,用来读报道和报纸。报道这方面会跟一些场景匹配,目前产品还正在研发当中。上午也有几位媒体同行跟我聊,问AI写稿方面的前景怎么样,这方面我也想就我们自己的一些探索聊一聊自己的感受。
刚才讲的是AlphaGo的情况,在国外权威的专家来判断,AlphaGo大致相当于人类婴儿4岁的智商。注意,我只是用了智商,没有用智力、意识这样的词,也就是说智商而已。可想而知,如果让一个4岁的小孩写文章给我们在座的各位看,我相信没有人会看,可能一个正常人也不会愿意看一个4岁小孩写出的文章。所以AlphaGo它虽然能够打败科技,但是如果用来写文章,显然抢不了我们在座任何一个人的饭碗。
所以,我们应该尽管去尝试机器写作。大家尽可放宽心,以目前的发展速度来讲,机器写作不会抢新闻从业者的饭碗。目前我们所用的人工智能的技术和理论,基本是过去30多年来,以孙怀民、渠川璐等老一辈的计算机科学家的研究基础所奠定的,目前还看不出来在这方面会有一个巨大突破口。
在他们两人之后,中国或者是华人在这个领域里,人工智能领域最厉害的有两个人,一个刚刚跳槽的百度的吴恩达,曾任谷歌首席科学家,他们夫妇俩都是人工智能的科学家。还有一个名叫杨强的美籍华人,现在在香港担任华为实验室的首席科学家。这些计算机科学方面的专家,在人工智能领域里面的主流观点是:人工智能的突破不仅仅是考虑计算机科学的进步,计算机科学只能做一些形式逻辑的推理,但是计算机科学解决不了人的认识和人的意识问题。
现在生物医学,生物学,化学,物理学都尝试在不同领域里面对人的意识机制,人脑运行的机制进行研究,取得了很多的进步和突破。但是,这些成果都还没有运用到人工智能领域里来,也就是说到今天为止人工智能还像是一个黑箱子。比如,我们设定一个目标,让计算机去做什么事情,然后我们输进去了一堆数据,最后出来了一个我们认为可用的结果。我们无法解答这黑箱子里边是怎么运行的,得到的这个结果它为什么能模拟人的意识。人类到现在为止,连自己的意识到底是以什么样的机制运行还不清楚。一个人到底为什么活着,人死了有没有意识,意识到哪去了,意识产生的机制是什么,我们都一无所知。
我们在推理逻辑方面所做的工作里,AlphaGo做到了4岁小孩水平,但并不是说它有4岁小孩的喜怒哀乐,它不过是一台没有情感,也没有意识的机器。所以,AlphaGo要想成长到拥有情感和意识,什么时候由4岁变成长到14岁,我觉得光靠吴恩达、杨强这样的科学家恐怕不够,还需要其他领域的专家去研究。比如,人的意识形成时到底发生了哪些化学变化,需要化学家去研究;人在形成一个意识的时候到底是有哪些神经的触碰,需要神经医学家去发现,需要物理学家进行原子以下的微粒分析,甚至还需要心理学家来研究人的心理形成的机制,这些都还是空白点。
所以,我做一个结语,既然4岁智商的AlphaGo已经能够打败科学,美国的实验表明自动驾驶可以连开2天甚至更多天,我相信生活当中会有一些领域,一些职业被人工智能所打败。
但是,并不代表人工智能已经能由4岁突破到14岁,用4岁的智商打败人类就可以说人工智能可以代替人的工作了。
回到新闻行业,我相信如果是重复性的工作,能够被4岁智商的AlphaGo来代替。但是对于我们这么一个热爱文字,热爱方块字,热爱文学的民族而言,想要代替我们去写诗,去写对联,去写那些激扬的文字,去写马克思主义政论,我相信现在的AlphaGo还没有这样的情感,还没有这样的推理,也没有这样的意识能力。
我的一些思考就介绍到这,谢谢大家。