趣投顾 2.5亿美元 !OpenAI打包新闻集团5年版权,用于大模型训练及问答
ChatGPT再扩容,这次将加入十余家媒体的新闻内容。
当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。
根据协议,OpenAI将能在ChatGPT中显示新闻集团旗下媒体的内容并用于回答用户的问题。同时,新闻集团将分享新闻专业知识,以帮助确保OpenAI的产品达到最高的新闻标准。
据外媒援引知情人士的话称,该交易为期五年,交易价值或超过2.5亿美元(约合人民币18.1亿元),包括现金形式以及使用OpenAI技术的信用额度。
此外,此次合作不包括访问新闻集团其他业务的内容。OpenAI表示,最终目标是让人们能够根据可靠的信息和新闻来源做出明智的选择。
OpenAI CEO山姆·奥特曼表示:"我们与新闻集团的合作是新闻业和科技界引以为豪的时刻。我们非常珍视新闻集团作为全球突发新闻报道领导者的历史,并很高兴能加强用户对其高质量报道的访问。我们将共同为未来奠定基础,让人工智能深深地尊重、增强和维护世界级新闻报道的标准。”
此前,OpenAI已宣布和美国社交平台Reddit合作,可访问后者数据API(应用接口)的实时内容,并将内容引入ChatGPT等产品中。也与《金融时报》、美联社、《世界报》等多家媒体达成协议,授权使用资料库来训练AI(人工智能)模型。
但据外媒报道,上述与不同媒体合作的内容略有差别,例如美联社合作每年仅价值数百万美元,主要集中在将文本档案库内容用于培训。OpenAI与《金融时报》合作价值在每年500万-1000万美元,其中包括新闻内容的展示。
不过,OpenAI的版权合作之路也并不一帆风顺。《纽约时报》、The Intercept、《纽约每日新闻》等数十家媒体已提起版权侵权诉讼,指控OpenAI非法使用其新闻内容来培训AI(人工智能)模型。
对于使用公开的互联网材料训练AI模型,OpenAI表示,这种合理使用得到了长期存在,并有广泛的先例支持。这一原则对创造者公平,对创新者必要。尽管如此,公司还为出版商提供了一个简单的选择退出流程,以防止公司的工具访问纽约时报这样的网站。
OpenAI称,由于大模型是从人类知识的巨大集合中学习,因此任何一个部门都只是整体训练数据的一小部分,任何单一数据源,包括《纽约时报》,对于大模型的预期学习并不重要。
新闻集团旗下的《华尔街日报》指出,AI公司对出版商的内容如饥似渴,这些内容可以帮助完善模型,创建新产品,如AI驱动的搜索。出版商正在寻求确保能为使用自己的知识产权获得高额报酬,从而引发了整个行业复杂且有时甚至相当激烈的谈判。
根据外媒报道,在新闻集团与OpenAI达成的协议中,确保新闻内容不会在发布后立即在ChatGPT上提供。这是目前出版商们比较担忧的方面,即AI根据新闻内容提供完整的答案,用户无需登录新闻网站付费获取,出版商损失流量和广告收入。
外媒援引知情人士的说法称,OpenAI正寻求在回答内容的摘要下给出相关链接趣投顾,让用户看到这些内容来源于哪些出版合作伙伴。