Adobe製品で作った作品がAIの学習に使われる?規約変更に関するデマに注意
Adobeの製品を使って作った作品が機械学習に利用される——そんなセンセーショナルな情報がインターネットを駆け巡った。しかし、これは事実ではない。利用規約の一部を誤って解釈したインターネットユーザーと、注意深く確認せずにそれを記事にしたメディアによって、誤った情報が急速に広まった。今回は、利用規約を注意深く読み解きながら、真相を探っていく。
Adobe製品で作った作品がAIの学習に使われる?
日本時間の6月5日ごろから、X(旧Twitter)を中心として、Adobeの製品を使って作った作品が機械学習に利用されるという情報が拡散された。Adobeの利用規約が改定され、ユーザーが作成したコンテンツをAdobeが無断でAIのトレーニングに利用できるようになったというのだ。
しかし、これは利用規約の一部を都合よく切り取って解釈した結果として生まれた誤解である。利用規約の全体を注意深く読むと、そのような意味で記載されていないことが分かる。
Adobeは2月17日に利用規約を改訂した。今回、その内容をユーザーに対して明確に伝えるためのメッセージを表示したため、多くのユーザーの目に留まり、議論を呼んだ。確かにAdobeの新しい利用規約は誤解を招きやすい書き方となっているが、注意深く読めば話題になっているような内容ではないことが分かる。
話題となったのは、Adobeの利用規約の第2.2条「アドビによるお客様の本コンテンツへのアクセス」だ。このセクションには、次のように書かれている。
2.2 アドビによるお客様の本コンテンツへのアクセス 当社はお客様の本コンテンツ(下記の第4.1条(コンテンツ)で定義)に対し、自動および手動の方法でアクセス、表示、監視を行いますが、これは限定的な方法で、かつ法律が許容する範囲に限ります。例えば、アドビは本サービスおよび本ソフトウェアを提供する目的で、第4.1条の詳細な規定に従って、(A)フィードバックまたはサポート要求に対応するため、(B)詐欺、セキュリティ上の問題、法的または技術的な問題を検出、防止、解決するため、および(C)本条件を適用するために、お客様の本コンテンツにアクセスして、それを表示、監視しなければならない場合があります。当社は、本サービスおよび本ソフトウェアならびにユーザーエクスペリエンスを改善する目的で、自動化されたシステムにより機械学習などの技術を使用して、お客様の本コンテンツおよびCreative Cloudお客様フォント(以下の第3.10条(Creative Cloudお客様フォント)に定義)を分析することができます。アドビが機械学習を使用する方法について詳しくは、http://www.adobe.com/go/machine_learning_jp を参照してください。
Adobe製品で作成したコンテンツがAIの学習に利用されると主張する人々は、この文章の後半部分をとくに問題視している。この記述により、Adobeがユーザー生成コンテンツを機械学習の学習データとして勝手に利用できるようになるというのだ。
しかし、よく読んでほしい。「自動化されたシステムにより機械学習などの技術を使用して、お客様の本コンテンツおよびCreative Cloudお客様フォント(以下の第3.10条(Creative Cloudお客様フォント)に定義)を分析することができます」これは、機械学習に利用する、ではなく機械学習を使用して分析する、と書かれている。Adobeはユーザーのコンテンツを機械学習の学習データとして利用するとは書かれていない。
では、Adobeはユーザーのデータを具体的にどのように分析するのだろうか。詳細については、リンク先を確認するように書かれている。リンク先を読むと、「Adobe は、当社の製品およびサービスの改善および開発を目的として、お客様の Creative Cloud または Document Cloud コンテンツを分析する場合があります」と書かれている。また、「デバイスでローカルに処理または保存されたコンテンツは分析しません」とも書かれている。
つまり、Adobeは製品の改善や開発のために、クラウド上に保存されたコンテンツを分析することがあるが、デバイスに保存されたコンテンツは分析しないということだ。
このようにサービスの改善を目的としてユーザーのデータを収集し、分析することは、「テレメトリー」と呼ばれ、多くのソフトウェアで一般的に行われている。たとえば、WindowsやAndroidといったOSから、それらの上で利用しているソフトウェアまで、多くの製品がテレメトリーを収集している。筆者はApple製品を所有していないので、Appleがどのような対応をしているかは分からないが、おそらくは同様にテレメトリーを収集しているだろう。
たいていは初期設定で有効になっており、ユーザーが設定で無効にしない限りはユーザーのデータを収集し、サーバーに送信するように設計されている。テレメトリーの賛否についてはさまざまな意見があるだろうが、テレメトリーを収集することによって、製品のバグをいち早く特定したり、ユーザーのニーズに合わせて機能を開発したりできるという側面がある。Adobeは、そうしたデータを収集している企業のひとつにすぎない。
Adobeは「Firefly」と呼ばれる画像生成AIを提供している。今回、新しい利用規約を懸念していたユーザーは、自らが作成したコンテンツをこのFireflyの学習に利用されるのではないかと問題視していた。
AdobeはFireflyのトレーニングに関するFAQを公開しており、どのようなデータを学習に利用しているかについて明記している。それによると、「Adobe Stock などのライセンスを取得したコンテンツや、著作権の期限が切れた公有コンテンツ」を学習に利用しており、「Creative Cloud サブスクライバーの個人コンテンツではトレーニングを行いません」としている。
Adobe Stockのコンテンツを学習に利用することに関しての議論はあるが、少なくともAdobe製品を利用したことで生じたコンテンツが学習に利用されることはない。
いずれにしても、Adobeがユーザーのコンテンツを機械学習の学習データとして利用するという主張は事実ではない。「機械学習に使う」のではなく「機械学習で分析する」ことはあるが、そのような処理は多くの企業が実施しており、珍しいことではない。
Adobe製品を使うと機密保持契約に違反する?
前述のAdobeの利用規約について、一部のユーザーはもうひとつの懸念を示している。それは、Adobeの製品を使うと機密保持契約(NDA)に抵触するのではないか、というものだ。
利用規約の第2.2条の内容は、第4.1条で規定される「アクセス」に関するものと、機械学習による分析に関するものに分けられる。前者では、Adobeが「お客様の本コンテンツ(下記の第4.1条(コンテンツ)で定義)に対し、自動および手動の方法でアクセス」するという内容が書かれている。これが機密保持契約に違反するというのだ。
懸念を表明しているユーザーは、Adobeがアクセスするとしている「本コンテンツ」はクラウドのコンテンツに限定されないと指摘している。しかし、Adobeの利用規約の内容が、これらのユーザーが懸念しているような内容ではないことは確かだ。
Adobeは声明の中で、「Adobe アプリケーションおよびサービスが設計され、使用される機能(ユーザーのためにファイルを開いて編集したり、共有用のサムネイルやプレビューを作成したりするなど)を実行する」ために、ユーザーのコンテンツへのアクセスが必要だと説明している。「お客様は自身のコンテンツを所有し、Adobe はお客様の作品の所有権を一切負いません」
つまり、ここでいう「アクセス」は、ユーザーのコンテンツを編集したり、プレビューを作成したりするためにAdobeのソフトウェアがファイルを読み込むためのものであり、ユーザーのコンテンツを勝手に利用することを意味しているわけではない。
問題となっている「アクセス」について規定している第4.1条も確認しておこう。第4.1条には、次のように書かれている。
4.1 コンテンツ 「本コンテンツ」とは、お客様が本サービスおよび本ソフトウェアにアップロードし、読み込み、使用できるように埋め込み、または本サービスおよび本ソフトウェアを使用して作成するあらゆるテキスト、情報、コミュニケーション、または素材(例えば、オーディオファイル、ビデオファイル、電子文書、画像)を意味します。 当社は、お客様の本コンテンツのいずれかが本条件に違反していることが明らかになった場合に、当該本コンテンツを削除し、または本コンテンツ、本サービス、および本ソフトウェアへのアクセスを制限する権利を留保します。ただし、削除や制限を行う義務はありません。アドビは、本サービスおよび本ソフトウェアにアップロードされたすべての本コンテンツをレビューしているわけではありませんが、利用可能な技術や、ベンダー、プロセス(手動のレビューなど)を用いて、特定の種類の違法コンテンツ(児童に対する性的虐待に関する素材など)またはその他の不正なコンテンツや行為(スパムやフィッシング詐欺特有の行動パターン、成人向けコンテンツが成人向け領域の外に掲載されていることを示すキーワードなど)をスクリーニングすることができます。コンテンツのモデレーション方法など、当社のコンテンツモデレーションに関するポリシーと慣行について詳しくは、透明性センターを参照してください。
確かに、「本コンテンツ」はクラウドのコンテンツに限定されていないが、前述のように、利用規約における「アクセス」は、ユーザーのコンテンツを編集したり、プレビューを作成するためのものである。
ただし、Adobeのクラウドにアップロードしたコンテンツについては、Adobeがスクリーニングすることが明記されている。一方で、ローカルのコンテンツに対してスクリーニングを実施するとは書かれていない。「本サービスおよび本ソフトウェアにアップロードされたすべての本コンテンツをレビューしているわけではありませんが」という記述がポイントだ。Adobeがローカルのコンテンツもスクリーニングするのであれば、「本サービスおよび本ソフトウェアにアップロードされた」という表現は不要だろう。
つまり、ローカルのコンテンツも「本コンテンツ」に含まれるが、スクリーニング対象ではない、と考えるのが妥当だろう。
アップロードされたコンテンツを運営会社が審査することは「モデレーション」と呼ばれ、多くのサービスで行われている。たとえば、YouTubeやX(旧Twitter)、FacebookなどのSNSでは、ユーザーがアップロードしたコンテンツを運営会社が審査し、違反コンテンツを削除することがある。Googleドライブの利用規約では、「Google は、コンテンツが違法か否か、または Google のプログラム ポリシーに違反しているか否かを判断するために、コンテンツを審査することができます」とされている。Adobeも同様に、アップロードされたコンテンツをモデレーションしているということだ。
したがって、Adobeのクラウドにアップロードすると機密保持契約に違反する可能性があるが、ローカルで使う分には問題ないと考えられる。そもそも、Adobeの利用規約の内容にかかわらず、機密保持契約を結んでいる仕事でクラウドを使うことは避けるべきだ。
ただし、Adobeの利用規約が実際に機密保持契約に違反するかどうかは、契約内容に依存するため、一概にはいえない。また、筆者は法律の専門家ではないので、心配な場合は契約相手や弁護士に相談することを推奨する。
機械学習による分析をオフにする方法
前述のように、Adobeはユーザーのコンテンツを機械学習の学習データとして利用するのではなく、機械学習を使用して分析することがある。しかし、心配なユーザーは、機械学習による分析をオフにできる。
Adobeアカウントのデータとプライバシー設定ページで[コンテンツ分析]をオフにすることで、機械学習による分析を停止できる。一般的なテレメトリーの送信も停止したい場合は、[デスクトップアプリケーションの使用状況]もオフにしよう。ただし、これらの設定をオフにした場合でも、クラウドにアップロードしたコンテンツに対するモデレーションは実施される。また、ソフトウェアのベータ版を利用している場合など、一部のケースでは設定が反映されないことがあるので、注意が必要だ。
それでも心配な場合は、Adobeの製品をオフラインで利用できる。Adobe Creative Cloudの製品は、ライセンス認証のために定期的なインターネット接続が必要なものの、常にオンラインである必要はない。一定期間はオフラインで利用できるオフラインモードが用意されているので、それを利用するとよいだろう。
また、Adobe以外のソフトウェアを利用することも検討してみよう。Adobeの製品は優れたものが多いが、他のソフトウェアにも優れたものがある。GIMPやInkscape、Krita、paint.netなどのオープンソースのソフトウェアも、Adobeの代替として利用できる。これらのソフトウェアは、動作するためにインターネット接続を必要としない。
インターネットの「集合知」の危うさ
今回の騒動は、Adobeが利用規約の変更についてユーザーにリマインドしたことをきっかけとして、一部のユーザーがAdobeの利用規約の一部を切り取って解釈し、それを拡散した。さらに、その情報を精査せずに鵜呑みにして記事にしたメディアもいた。
日本では、3D CGについての情報を発信しているとあるWebサイトのX(旧Twitter)アカウントが取り上げたことで話題になった。記事執筆時点では、その投稿は2.3万回以上リポスト(リツイート)され、453万回以上閲覧された。
2022年に総務省情報通信政策研究所が実施した調査では、日本人のTwitter利用率は45.3%となっている。2022年の日本の人口は約1億2,495万人なので、約5,660万人がTwitterを利用していることになる。今回の投稿を閲覧した人数は、日本のTwitterユーザーのうちの約8%に相当する。実際には、これ以外にも同様の内容を扱った投稿が多くあることや、閲覧したのが日本人だけではないことから、単純に8%とはいえないが、多くの人がこの情報に触れたことは間違いない。
SNSの発達によって、情報が瞬時に拡散されるようになった。人々の「集合知」によって、メディアのデマが暴かれることがある一方で、センセーショナルな情報が真偽を問わず拡散されることもある。今回の騒動は、後者の例として挙げられるだろう。
「AdobeがユーザーのコンテンツをAIの学習に利用できるように規約を変更した」という情報と「AdobeがユーザーのコンテンツをAIの学習に利用することはない」という情報では、前者の方がインパクトがあり、拡散されやすい。
また、今回の情報を広めた人々は、Adobeの利用規約の一部をスクリーンショットで撮影して添付していたことで、多くの人々がその主張を信じてしまった。しかし、利用規約全体を丁寧に読み解くと、そのような主張は事実ではないことが分かる。
今回の事例は、インターネットの「集合知」の危うさを示している。一見それらしく見える情報でも、その真偽を精査することが重要だ。とくに、文章の一部分だけを読むのではなく、全体を丁寧に読み解くことが大切だ。情報を拡散することで、誤った情報が広まることがないよう、注意深く情報を扱うことが求められる。