第8版:理论·践悟

关于新闻写作机器人的发展与思考

  • 表一

  • 表二

  •   新闻写作机器人是一种自然语言生成引擎,利用算法程序,通过采集大量的各种题材的数据,建立各种分类的庞大数据库,借助人工智能实现从数据到知识、见解和建议的提升和跨越,最后由机器自动化生产新闻。
      虽然早在20世纪70年代,耶鲁大学已经开始研究“故事写作机器人算法”,但是“新闻写作机器人”技术的发展要等到2000年之后,随着互联网广泛利用才逐步兴起,初期主要向财经、体育等数据量大、程式化高的报道领域提供新闻写作服务。

    一、新闻写作机器人发展情况

      1.新闻写作机器人发展源起
      2006年初,商业数据供应商汤普森公司(Thomson Corporation)开始使用计算机程序对相关财经数据进行加工处理,并整合成完整的新闻报道文本。汤普森公司通过程序撰写的主要是经济和金融方面的新闻,用以取代传统财经新闻记者所从事的事实类报道工作。汤普森公司声称它的机器人记者可以在公司发布信息后的0.3秒内提取有效数据,并分析整合成为一篇报道。这项技术在当时曾引起新闻业内广泛讨论。一些业内人士批评称:“机器人写作的新闻无法发现程式化的信息发布背后的细微差别,当然也无法更深入地揭示数据背后的含义。”
      2009年,美国西北大学智能信息实验室研发并推出了一款名为“统计猴”(Stats Monkey)的软件。该软件能对棒球比赛中选手、比赛得分和获胜率等数据进行抓取和筛选,并在12秒内自动生成一篇完整的报道。2010年,“统计猴”项目的两位研发人员Kris Hammond教授和Larry Birnbaumn副教授在芝加哥成立了自然语言处理服务公司“叙事科学”(Narrative Science)。“叙事科学”公司先后推出了多款软件产品,以满足不同受众群体的需求。其中,“鹅毛笔”(Quill)的自动叙述生成系统可抓取原始数据,分析这些数据的意义,生成易于理解的信息内容,然后,运用自然语言来生成描述性或者叙述性的文本。Quill系统最初的客户是美国十大联盟,这是一个以体育为核心的美国大学联盟。从2010年起,该软件撰写了“十大联盟”数千项大大小小体育赛事的新闻,它几乎是在比赛中进行实时报道,稿件不管是在数量上还是时效上都远超以往。
      2.新闻写作机器人在国外媒体的应用
      随着“新闻写作机器人”写作技术的进步,专业媒体逐步与技术公司开展合作,使用“新闻写作机器人”帮助报道,报道领域除财经、体育外,也进一步扩展到其他新闻领域。
      2014年3月,《洛杉矶时报》通过“Quake-bot”地震新闻生成系统,第一时间发布了地震报道,是当时所有新闻媒体中最先发布的突发新闻报道。这次报道,在新闻界引起较大震动。自此,越来越多的媒体开始使用机器人。
      2014年,美联社开始使用Automated Insights公司开发的新闻机器人“Wordsmith”编写财经和体育方面的资讯,其商业新闻中关于企业季度经营状况的报道量,从原先每季度300篇上升到4400篇。2016年,《华盛顿邮报》开发的新闻写作机器人“Heliograf”,能够分门别类地收集、整合各方信息,根据不同地区读者的需求,撰写符合受众需求的报道。路透社、彭博社、纽约时报、卫报等各大主流媒体逐步开发采用自己的人工智能写作工具。(详见表一)
      3.新闻写作机器人在国内的发展
      国内新闻写作机器人是在国外有初步应用成果的基础上,开始探索新闻写作机器人的发展。腾讯研发的机器人“Dreamwriter”,是在国内引起广泛关注的第一个新闻写作机器人,于2015年9月推出,主要应用在财经、体育、科技领域。“Dreamwriter”在国内人工智能写作方面,具有重要的意义。2015年11月,新华社技术局推出新闻写作机器人“快笔小新”,主要用于体育赛事、经济行情、证券信息等快讯、简讯类稿件的写作,是国内较早开始探索机器人新闻写作的主流媒体。2016年,阿里巴巴联手第一财经发布“DT稿王”,是一款帮助财经记者快速及时写稿的智能写稿系统,主要报道股市异动。同年6月,今日头条发布新闻写作机器人“张小明(Xiaomingbot)”,可生成简讯和资讯两种文本形式。2016年起,《人民日报》《光明日报》、封面资讯等多个媒体,陆续开发了满足自身新闻业务形态的新闻写作机器人产品。(详见表二)

    二、关于新闻写作机器人的评价

      1.优势
      一是实现新闻生产实时化。新闻写作机器人发展到今天,可以在数秒内生成一篇新闻作品。2017年8月8日21时19分,四川九寨沟县发生7.0级地震。中国地震台网机器人自动编写稿件,仅用25秒出稿,540字并配以4张图片。此后一系列余震消息,自动编写速度最快的仅用时5秒。机器人新闻写作不受时空限制,不受人力限制,新闻事件实时发生,新闻稿件实时生产、实时传播。
      二是减少了新闻生产中的简单重复劳动。在以往的新闻生产过程中,有大量简讯、快讯类的新闻,技术含量不高,但是耗费精力不少。机器人新闻写作的广泛应用,极大解放了人力,让新闻采编人员从简单重复劳动中解放出来,重构了新闻生产流程。
      2.局限
      一是误报风险。由于机器人新闻写作是由程序获取数据等相关素材后自动生成新闻。程序本身无法自主判断事件的真伪,对新闻的误报难以杜绝。例如在过往发生的地震新闻报道过程中,美国、日本、中国都发生过程序误报地震的情况。
      二是难以写作复杂新闻。自2006年算起,机器人新闻写作发展已有16年,但是发展到今天,机器人新闻写作仍然只能替代新闻写作中的简单程序化部分,主要应用领域仍然是财经、体育等数据驱动类型的新闻。
      三是在新闻版权、新闻伦理等方面仍存在争议。机器人生产的新闻作品版权归谁所有?获取不同读者的信息自动匹配特定新闻,是否有侵犯隐私权的嫌疑?这些问题还需要进一步进行讨论。

    三、新闻写作机器人未来发展的思考

      2019年之后,新闻写作机器人的曝光度和关注度都有所回落。人工智能与新闻生产融合的过程中,新闻写作机器人不再是发力的重点,人工智能作为加强新闻生产各个环节的工具出现。
      关于新闻写作机器人,有能力的媒体,可以通过抽选大量的优质新闻形成机器的训练库,大幅提升机器新闻写作的质量。以新华社为例,近两年,快笔小新逐渐变为记者写稿发稿的辅助工具,没再出现大跨越的升级迭代。笔者认为,由于不同类别的新闻,对写作要求差别比较大,可将新华社新闻发稿库的稿件以不同的标签进行分类,以一个程序对应特定的一类新闻稿件,有专门写简讯的程序,也有专门写长篇通讯的程序,面对不同的写作诉求调用不同的程序执行任务,以实现机器新闻写作的专业化和个性化。 (作者:新华社中国图片社 赵亮 苏凯)

    分享到:

    过往期刊

    • 第2022-10-24期

    • 第2022-10-23期

    • 第2022-10-22期

    • 第2022-10-21期

    • 第2022-10-20期

    • 第2022-10-19期

    • 第2022-10-18期

    • 第2022-10-17期

    • 第2022-10-16期

    • 第2022-10-15期

    分享到微信朋友圈