“金融時報授權OpenAI存取資料庫,共同開發AI驅動產品”
金融時報正授權OpenAI使用其新聞存檔作為資料來源,這同時也展現了產生式AI公司持續尋找私人數據來源的態勢。
此次配套方案涵括ChatGPT會提供金融時報完整文章的摘要、直接引用以及超連結,這些超連結會直接連結回金融時報網站上的原始內容。
作為這項交易的一部分,OpenAI已承諾與金融時報合作開發新的AI驅動產品。金融時報是ChatGPT的企業客戶,並且已經試過使用AI,將Anthropic的Claude整合到一種名為“問金融時報”的產生式搜索工具中。
金融時報的CEO約翰·瑞丁,談到此交易時說明,“除了對金融時報的好處外,對行業也有更廣泛的影響。AI平台應該為使用出版商的材料付費,這是理所當然的。OpenAI明白透明度、歸因和補償的重要性,這些對我們來說都是必不可少的。”
雖然這是一種公正的觀點,但有些人不同意OpenAI理解透明度和歸因的重要性。
OpenAI的首席營運官Brad Lightcap也附和道:“我們與金融時報的夥伴關係和持續對話是關於尋找創新與實踐的方式,以讓AI賦權新聞組織和記者,並用實時、世界一流的新聞為全球數百萬的ChatGPT用戶提供豐富的體驗。”
儘管可以獲取金融時報的數據對OpenAI相當有價值,但其目前的數據集包含數萬億字元數的公開或開源數據。
與金融時報和其他媒體公司如Axel Springer等的協議,是因為AI公司認識到他們需要開始購買數據以應對日益增加的法律壓力。他們也深深地意識到,如果沒有新鮮、高品質的數據,他們的模型將迅速過時。
AI公司對數據的爭奪
AI中使用的數據在道德上蘊含著巨大的風險。在他們無休止的尋找數據的過程中,像OpenAI、Google和Meta這樣的科技巨頭被報導進行推動或直接跨越法律和道德界限的行為。
舉個例子,紐約時報的一項調查揭示了OpenAI開發了一個名叫Whisper的工具,用於轉錄YouTube影片的內容,儘管這可能違反了YouTube對其影片用於獨立應用的政策。
同樣地,Google和Meta也探索或實施策略來繞過或重新詮釋現有的版權和隱私法律,以收集更多數據。
其中較為陰暗的策略包括修改隱私政策,允許AI應用從如Google Docs等平台中使用公開可用的內容。
儘管AI公司現在願意支付數據,但這並不能讓他們避免在其他地方扭曲規則的情況。





金融時報向OpenAI開放其新聞檔案庫,為生成型AI公司繼續確保私有資料來源。
金融時報與OpenAI的安排將包含提供由金融時報出版的全文文章的摘要、直接引用及超鏈接,並直接鏈接到該網站上的原始內容。
作為該交易的一部分,OpenAI已承諾與金融時報合作,開發新的AI驅動產品。金融時報是ChatGPT的企業客戶,並曾經試用AI,將Anthropic的Claude納為名為”Ask FT.”的生成式搜尋工具。
金融時報CEO John Ridding對此交易表示:“除了金融時報的利益之外,此事還對整個行業產生了廣泛的影響。當然,AI平台應該支付出版商使用他們的材料的費用。OpenAI明白透明度、歸屬和補償的重要性,這對我們來說是必不可少的。”
OpenAI的首席營運長Brad Lightcap也同意:“我們與金融時報的夥伴關係和持續對話的目標是尋找創意和生產力的方式讓AI賦予新聞機構和記者力量,並以即時、一流新聞豐富全球數以百萬計的人的ChatGPT體驗。”
訪問金融時報的數據對OpenAI來說非常具有價值,儘管其目前的數據集由數以兆計的“公開”或“開源”數據構成。
眼下,AI公司已意識到需要為數據付費以應對不斷增加的法律壓力。他們還深感,如果沒有新鮮、高質量的數據,他們的模型將很快變得過時。
AI公司為數據而戰
AI數據使用的道德風險非常大。在他們對數據無止境的追求中,像OpenAI、Google和Meta這樣的科技巨頭被報導使用了跨越或直接違反法律和道德邊界的行為。
例如,《紐約時報》的調查揭示OpenAI開發了一種名為Whisper的工具來轉錄YouTube視頻,儘管這可能違反YouTube對使用其視頻的獨立應用的政策。
同樣,Google和Meta已經探索或實行了包含繞過或重新解釋現有版權和隱私法律來收集更多數據的策略。
其中比較不明显的策略也包含修改隱私政策以允許AI應用從Google Docs等平台使用公開可得得內容。
雖然AI公司現在願意付錢購買數據,但這並不代表他們不會在其他地方扭曲規定。
The Financial Times and OpenAI strike deal over training data
(引文來源:完整新聞連結)