作家起訴OpenAI 文本成為訓練素材
(中央社訊息服務20231016 13:07:14)近年大型人工智慧(AI)興起,須以大量的素材訓練AI的語言模型。OpenAI用於訓練ChatGPT演算法的資料,有一些資料受到著作權法的保護,自2023年7月即有作家向美國法院起訴主張OpenAI侵害著作權。
2010年出版《The Bedwetter》一書的作家Sarah Silverman,在起訴OpenAI的同時,也起訴Meta。聲明指出OpenAI開發的ChatGPT,和Meta開發的LLaMA使用受著作權保護的文本訓練,所以AI的產出是受著作權保護作品的衍生著作,構成著作權侵害。OpenAI則指出,著作權法是藉由保護作者的表達,以達成促進科學與文化的目標;而不是保護潛在的想法。OpenAI引用作家協會起訴Google (Authors Guild v. Google)的判決,提醒法院關於統計的資訊,例如用詞頻率(word frequencies)、語法模式(syntactic patterns)與主題標示(thematic markers),不在著作權法保護的範圍。
作家John Grisham、Jodi Picoult和George RR Martin等也起訴OpenAI,主張AI程式未經他們同意,就使用各個作家受著作權保護的作品進行訓練。作家們認為,ChatGPT公然的侵害作家的著作權,進行大規模的系統性抄襲。OpenAI的聲明中則表示,尊重作家們的權利。但是OpenAI同時也認為,原告們的主張,誤解著作權的範圍,而且沒有考慮到像是合理使用的限制與例外;而著作物使用的限制與例外,將預留創新的空間,例如AI的語言學習模型。
關於AI的資料學習行為,與合理使用相關。美國法典第107條(17 U.S. Code § 107)規定,若是為批判、評論、新聞報導、教學,或學術研究而使用文本,則不屬於侵害著作權。並提出判斷是否屬於合理使用的四項考量因素,分別為:(1)使用的目的與性質;(2)受著作權保護的作品性質;(3)使用受著作權保護作品的比例;(4)對使用受著作權保護作品的價值,和潛在市場的影響。目前相關的訴訟程序仍在進行中,關於可以用來訓練AI的資料,資料的使用程度,和是否屬於合理使用,仍需由法院依個案情況判斷。
【資策會科技法律研究所官網】
https://stli.iii.org.tw/
【新聞聯絡人】
資策會科法所 顏翩翩
Tel: (02) 6631-1084
Email: pienpienyen@iii.org.tw