更多訊息

作家起訴OpenAI 文本成為訓練素材

發稿時間：2023/10/16 13:07:14

(中央社訊息服務20231016 13:07:14)近年大型人工智慧(AI)興起，須以大量的素材訓練AI的語言模型。OpenAI用於訓練ChatGPT演算法的資料，有一些資料受到著作權法的保護，自2023年7月即有作家向美國法院起訴主張OpenAI侵害著作權。

2010年出版《The Bedwetter》一書的作家Sarah Silverman，在起訴OpenAI的同時，也起訴Meta。聲明指出OpenAI開發的ChatGPT，和Meta開發的LLaMA使用受著作權保護的文本訓練，所以AI的產出是受著作權保護作品的衍生著作，構成著作權侵害。OpenAI則指出，著作權法是藉由保護作者的表達，以達成促進科學與文化的目標；而不是保護潛在的想法。OpenAI引用作家協會起訴Google (Authors Guild v. Google)的判決，提醒法院關於統計的資訊，例如用詞頻率(word frequencies)、語法模式(syntactic patterns)與主題標示(thematic markers)，不在著作權法保護的範圍。

作家John Grisham、Jodi Picoult和George RR Martin等也起訴OpenAI，主張AI程式未經他們同意，就使用各個作家受著作權保護的作品進行訓練。作家們認為，ChatGPT公然的侵害作家的著作權，進行大規模的系統性抄襲。OpenAI的聲明中則表示，尊重作家們的權利。但是OpenAI同時也認為，原告們的主張，誤解著作權的範圍，而且沒有考慮到像是合理使用的限制與例外；而著作物使用的限制與例外，將預留創新的空間，例如AI的語言學習模型。

關於AI的資料學習行為，與合理使用相關。美國法典第107條(17 U.S. Code § 107)規定，若是為批判、評論、新聞報導、教學，或學術研究而使用文本，則不屬於侵害著作權。並提出判斷是否屬於合理使用的四項考量因素，分別為：(1)使用的目的與性質；(2)受著作權保護的作品性質；(3)使用受著作權保護作品的比例；(4)對使用受著作權保護作品的價值，和潛在市場的影響。目前相關的訴訟程序仍在進行中，關於可以用來訓練AI的資料，資料的使用程度，和是否屬於合理使用，仍需由法院依個案情況判斷。

【資策會科技法律研究所官網】
https://stli.iii.org.tw/

【新聞聯絡人】
資策會科法所顏翩翩
Tel: (02) 6631-1084
Email: pienpienyen@iii.org.tw