■ はじめに 学習済みモデル生成のためには大量の生データや生データを元に生成した学習用データセットが必要となりますが、その際に著作物である生データ(文章、写真、静止画、動画など)を利用することも多くあります。 著作権法上、著作物は著作権者に無断で利用(ダウンロードや改変等)することは出来ませんが、実は日本の今の著作権法には47条の7という世界的に見ても希な条文があるため(詳細は後述)、AI開発目的であれば、一定限度で著作権者の許諾なく著作物を利用できます。 その点を捉えて、早稲田大学法学学術院の上野達弘教授は「日本は機械学習パラダイスだ」と評しています。言い得て妙ですね。 【参考】 コラム:機械学習パラダイス(上野達弘) ただ、この47条の7には「ある限界」もありました。 2019年1月1日に改正著作権法の施行が予定されていますが、同改正法が施行されると、この47条の7が廃止され、新しい条文である新30条の4や新47条の5が発効します。 これによりAI開発のために可能な行為がより広くなるため、AI開発がより加速し、AI関連企業にとっては非常に大きなビジネスチャンスとなる可能性があります。 この記事では、「現行著作権法47条の7で可能な行為」「現行著作権法47条の7の限界」「改正著作権法30条の4等により可能となった行為」についてまとめます。 なお、今回の著作権法改正は、文化審議会著作権分科会報告書(2017年4月)に基づいて行われていますので、この報告書を以下「2017年報告書」として適宜引用します。 ■ 現47条の7で可能な行為 まず、現47条の7で可能な行為を整理してみましょう。 モデル生成の際に行う作業 生データ収集からモデル生成の一連の流れを図にするとこのようになります。 この図で言う「データ収集」「データ処理」「機械学習、DL」とは、具体的には、データのコピーだったり、整形だったり、データセットを用いた機械学習や深層学習ですが、これらの行為は「複製」や「翻案」に該当することから、著作権者の承諾を得ない限り原則として著作権侵害となります。 日本の機械学習の救世主「著作権法47条の7」 しかし、そこで颯爽と現れるのが著作権法47条の7です。 著作権法47条の7は学習済みモデル生成に際しては非常に重要な条文ですのでぜひ覚えておいてください。