人工智能
查看话题 >人工智能时代新闻业旅行指南
A guide for newsroom in the age of smart machines;The future of augmented journalism.
美联社(AP)曾经发布一份人工智能运用于新闻业状况的报告,该报告是由Francesco Marconi、Alex Siegmen和Machine Journalist完成;我疑惑什么是“机器记者”?翻到作者简介这部分,得知:Machine Journalist“ is an amalgamation (合称) of various artificial intelligence systems”;在报告中,每一节的总结和要点框架都是由“Machine Journalist”制作完成。
从这里就可以看出,人工智能是有可能给新闻业带来全新的未来的。接下来我将美联社的报告择其要点,奉献给读者。
一、序言
AI在新闻业的潜力: 1.AI可以取代人类记者去完成琐碎的事情,使记者有更多的时间投身于更复杂、更高质量的报道中去; 2.AI可以增强记者间的联系和合作; 3.AI可以帮助记者筛选大量的数据、文本、图片和视频; 4.AI可以帮助记者与受众更好地交流和互动; 5.使创造全新的新闻业态得以实现。
二、未来的新闻业是怎样的
1.新闻业中的“自动化”意味着从许多琐碎的事务中减少人类的工作量,压缩工作时间,而记者就得从这些琐碎的事情中寻找新闻线索,制作新闻并发布给公众。 2.例如,国际调查记者联盟花费了两年时间,指挥着一只由400名记者组成的团队,团队分析着大约2.6 兆兆字节的泄露邮件、文件和数据库,最终结果就是Panama Papers。 面对日此庞大的数据量,通过AI,国际调查记者联盟得以对这些数据进行全面调查;通过AI,调查过程更快,而且最终结果和人工调查的结果是一致的。 3.以前,美联社的金融新闻记者每三个月就要进行一项兴师动众的任务:将尽可能多的上市公司收入报表录入数据库。三年前,当美联社试图覆盖更多公司收入报表的细节时,一个智能化程序走进了美联社,它使美联社以25%的速度不断增加着公司收入报表数量,基本上,美联社现在提供着覆盖整个美国股票市场的收入报表。
未来新闻业可能存在的问题
1.未被检查的算法给新闻生产带来的风险:AI算法像人类一样,存在偏向性;因此算法也要进行检查,需要达到标准,还要清楚算法的运用语境; 2.工作流程的“断裂” ①传统工作流程:reporter→desk editor→section editor→copy editor ②新的工作流程:reporter→desk editor+AI→section editor+AI→copy editor 一些有经验的编辑会建立一批报道模板以便AI自动输出财务报表、比赛得分等报道,但是记者编辑仍要仔细检查报道的细节,如有错误,就改正之。 3.技能鸿沟 在运用AI的背景下,出现了两种新的角色:data scientist(懂得怎么操作AI系统的人,懂得如何制作好新闻,懂得如何与记者沟通)和computational journalist(主要还是记者,但他们了解AI的原理,同时懂得如何运用AI来助力新闻报道;他们明白如何与data scientist进行沟通)。 三者都是新闻报道者,三者的唯一区别就是他们报道的媒介的不同(data scientist运用AI,computational journalist既用AI也用传统报道媒介,一般记者只用传统报道媒介)。
三、相关技术
1.Machine learning
机器学习是AI研究的亚领域:它指一个系统在没有被事先告知要做出调整的情况下进行的自我调整。 深度学习(deep learning):它是一种方法,它把复杂的目标拆分一系列更小、更容易学习的目标,并逐步学习,最终将会被带向被设计好的终点(目标)
机器学习又分两种: ①Surpervised learning:输入一系列被标记好的数据,AI利用这些被标记的数据确认新数据中哪些是与被标记的数据具有相同特征的数据,并将这些相同数据作为输出。系统接收的数据越多,输出的数据越精确。 ②Unsurpervised learning:输入一些非结构化的数据,没有输出目标;系统任意寻找输入数据和输出数据之间的关系。例:体育新闻记者将周末棒球比赛的得分情况输入AI系统,然而记者事先也不知道这些数据之间有什么关系,仅仅是为了去找潜在的数据模型。
2.Language
①NLG(natural language generation):将结构化、模板化的数据转换成可读的文字叙述。例:棒球赛得分情况自动录入数据库。 ②NLP(natural language processing):比较而言,NLG“写”,而NLP既要“听”,又要“读”、“写”;进一步来说,NLP是在理解数据的基础上,使数据文本化、可读化。例:实时外语口语翻译;大批量数据中的人物关系、金钱关系等。
3.Speech
①Text to speech:将文本转换成话语。AI利用新闻编辑室提供的新闻稿,用合称人声播报新闻。②Speech to text:将话语转换成文本。加字幕、将采访录音转换成文字。
4.Vision
用途 ①应用于调查性报道,到人类难以到达的地方进行调查; ②可识别化、可搜索化(如警察调查通缉犯,就可用将犯罪嫌疑人的头像输入AI,让AI在海量的监控视频中识别犯罪嫌疑人); ③感知情绪,分析现实事件,例:一群示威群众,记者可以从远处利用AI观察人群动向甚至人群的情感变化。
5.Robotics
用途 ①以一种前所未有的视角呈现新闻,例:无人机从空中呈现中东难民危机; ②搜集科学数据,展示更为深度的新闻;
四、AI的影响
1.AI在处不断变化的时代里节省时间和金钱,并试图在新闻深度和广度不断提升的情况下跟上这种步伐(scale↑ scope↑ speed↑); 2.Accuracy↑; 3.要求新闻工作者学习如何将智能技术运用到实际新闻报道中去; 4.其他的一些外部因素:如个人隐私、数据安全、假新闻等深层次的挑战。
五、结论
1.技术斗转星移,新闻业永恒:AI可以强化新闻业,带它取代不了新闻业;新闻业永远需要记者来将碎片组合成可理解的、创造性的叙述; 2.AI与人类一样,具有偏向性:AI由人设计,它也会出错; 3.AI不是万能的; 4.只有记者掌握了使用AI的技术,才能更好地使用它; 5.在AI新闻业中仍有职业道德和职业标准存在。