登入‧加入會員  | 購物車 |  購書服務 |  會員專區 |  會員Q&A |  書店公告 |  教師資源 |    sitemap 

元照

高級檢索

新書閱讀

研討會新訊

 看更多2025年月旦釋讀
發佈日期:2025/02/05
從生成式AI談德國漢堡法院判決LAION資料探勘構成著作侵權豁免


摘要
  ChatGPT開啟了生成式AI時代,廣泛應用至各領域。同時,「資料探勘」也已發展數十年,雖與生成式AI密切相關但兩者並不同,生成式AI的開發常依賴資料探勘作為前置作業。而資料探勘過程中涉及大量著作權資訊的複製,最終產出的結構化知識雖未必侵權,但對過程中素材複製是否侵權,始終存在爭議。國際間相關案例罕見,直到2024年9月德漢堡地院才在 LAION 案中首次作出實體判決。本文爰予介紹,並為生成式AI過程中大量複製提供參考。




本文目次
壹、資料探勘與生成式AI緣起
貳、TDM與生成式AI訓練過程擷取著作素材之侵權議題
參、資料探勘(TDM)之意涵
肆、TDM與生成式AI間之關聯
伍、本件LAION之案例事實
陸、本案原被告間之攻防
柒、漢堡法院駁回原告之訴的判決理由
捌、美國與我國資料探勘之侵權豁免/合理使用之法律考量──代結論


本文試讀
壹、資料探勘與生成式AI緣起
  人工智慧(AI)的發展歷史悠久更可謂源遠流長。如果不將1936年圖靈提出的「圖靈機」(Turing machine)概念計入,從1956年MIT約翰‧麥卡錫(John McCarthy)等學者創造出「Artificial Intelligence」一詞至今,已走過70個年頭。AI有好幾波載沉載浮的經歷,直至深度學習和類神經網絡技術的突破,才再度喚醒人們對AI的重視。尤其是AlphaGo在強化學習的基礎上接連擊敗世界棋王,徹底刷新了人們對AI的認識。然而,即便如此,AI在當時仍主要侷限於執行特定任務或解決特定問題。一直到2022年底,OpenAI推出的ChatGPT橫空出世,「生成式預訓練轉換模型」(Generative Pre-trained Transformer)的技術架構,催生出「生成式AI」(Generative AI),第一次可通過「圖靈測試」(Turing Test),才真正標誌起「通用人工智慧」(AGI: Artificial General Intelligence,亦稱強人工智慧)時代的開端,使AI能應用於更廣泛的領域和多樣化的工作。
  與此同時,「文字與資料探勘」(TDM: Text & Data Mining,以下稱「資料探勘或TDM」)這個議題也已發展數十年之久。資料探勘雖常與AI或生成式AI相關,但它並不等同於AI或生成式AI。資料探勘有其自身特定之目的,對AI或生成式AI而言,其前置作業經常需依賴資料探勘(雖然不一定是)。因此,資料探勘是許多生成式AI開發者不可或缺的基礎工作。儘管資料探勘與Transformer模型有所不同,卻毫無疑問是一項極其重要的基礎支撐技術。

貳、TDM與生成式AI訓練過程擷取著作素材之侵權議題
  資料探勘是對各種素材進行分析,包括文字、圖形、影像、聲音等,透過技術手段提取其關鍵之資訊如模式、趨勢或關聯性,將「非結構化數據」轉化為「結構化數據」,進而擷取其中的知識。值得注意的是,資料探勘所分析的內容往往包含大量攝取具有著作權的素材,但經過探勘轉化後所產生的結構化數據,未必與原始素材內容相同,而是以結構化形式呈現出知識。因此,資料探勘的中間過程確實涉及大量具有著作權資訊的複製,但其最終產出的結構化知識卻不見得會侵犯著作權。然而,針對探勘過程中對素材的複製行為是否構成著作權侵害,則向來充滿爭議,國際間與資料探勘相關的著作侵權案例極罕見,直到2024年9月27日德國案例Kneschke v. LAION e.V.(Large-scale AI Open Network),漢堡地院才首次對此類問題作出具體判決:駁回原告之訴 。
(本文未完)



 看更多2025年月旦釋讀