JANOG50「マンガ海賊版サイトの技術要素と対策法」レポート

はじめに

2022年7月13日(水)〜15日(金)に、JANOG50ミーティングが函館アリーナにて開催されました。ここで行われたセッションの中から、7月13日に行われた「マンガ海賊版サイトの技術要素と対策法」の模様をレポートします。

登壇者の皆さん。左から、石田さん、山下さん、宮内さん、高見澤さん

漫画村は終わったがマンガ海賊版サイト問題は全然終わっていない

はじめに石田慶樹さん(日本ネットワークイネイブラー)から、マンガ海賊版サイト問題の経緯や、政府・民間が取り組んでいる対策について説明がありました。

この問題の端緒は2016年に公開されたマンガ海賊版サイト「漫画村」で、これが2017年にCDNを利用したことで爆発的に広まり大きな問題となりました。対策もいろいろとなされて漫画村は閉鎖されましたが、その後もマンガ海賊版サイトは続々と発生しており、これらへのアクセス数も漫画村最盛期の4倍を数えています。マンガ海賊版サイト問題は終わっていないどころか、むしろ悪化しているとも言えます。漫画村がもたらした悪影響としては、罪を犯しても簡単に儲けられる仕組みを提示したこと、海賊版サイトのライトユーザを大量に生んでしまったことなどが挙げられます。

マンガ海賊版サイトへのアクセス数の推移 (出典:マンガ海賊版サイトの技術要素と対策法-当日資料)

マンガ海賊版サイトのシステム構成も提示されました。広告会社を使って収入を得て、レジストラにドメイン名を登録し、ストレージサーバーや防弾ホスティングを使い、CDNを使って低コストで海賊版コンテンツを届けています。インターネットのさまざまな仕組みを非常にうまく使って提供しているのが今の海賊版サイトです。

マンガ海賊版サイトのシステム構成 (出典:マンガ海賊版サイトの技術要素と対策法-当日資料)

この問題に対する取り組みは多々ありますが、中でも今回のセッションに深く関係するものとして、セーファーインターネット協会(SIA)による「海賊版対策実務者意見交換会」があります。出版社、通信・IT業界、およびそれを取り巻く法律関係者などが参加し、ユーザへの啓発活動や海賊版サイトへのアクセスを抑制するための連携施策を検討・実施しています。

そして、これの下部組織として、マンガ海賊版対策の技術検証チームが組成されました。このチームでは、海賊版サイトの分析や解析、およびそれに基づく対策を模索しています。今回登壇した方々はいずれもこのチームのメンバーです。

マンガ海賊版サイト対策にエンジニアが果たせる役割

次の発表は山下健一さん(さくらインターネット)です。マンガ海賊版サイト対策にエンジニアがどう貢献できるのかを、自身の体験をもとに発表しました。

山下さんは現在、さくらインターネットでabuse窓口の仕事をしています。abuseの仕事は簡潔に要約すると「インターネット上の公共における不適切な振る舞いについて対応する連絡窓口」ですが、対応する問題はサイバー攻撃、違法有害情報の発信、詐欺、権利侵害など多岐にわたります。詳しくはかつてさくナレで取材した記事があるのでご覧ください。

山下さんが本件に関わったきっかけは、abuse対応をする中で、漫画村がさくらのサーバ上にあるのではないかという問い合わせを受けたことでした。このときの調査では漫画村が読み込んでいる広告がさくらのサーバから配信されているらしいことがわかった程度で、それ以上の関連は見出だせなかったので静観し、その後は海賊版対策に関する検討会議の動向を注視していました。

そこへ海賊版対策実務者意見交換会が立ち上がり、山下さんにも声がかかって参加することになりました。当初は話を聞いているだけでしたが、あるとき「CDNなしにマンガの海賊版サイトって作れると思いますか」という質問を受け、直感的に「作れないと思います」と回答したものの、どうして作れないと思ったのか自分で疑問に思い、サイト構成を推定する試みを始めました。その成果を意見交換会に持ち込んで査読をお願いしたところ何人か協力者が現れ、そのメンバーで技術検証チームが結成されました。

エンジニアと非エンジニアがインターネットに抱くイメージの違い (出典:マンガ海賊版サイトの技術要素と対策法-当日資料)

これらの体験を通して山下さんが感じたのは、エンジニアと非エンジニアではインターネットの解像度に差があることです。エンジニアはオペレーションやその結果を見ることでネットワークがつながっていることを体感していますが、非エンジニアにはそれがありません。ただやみくもに法律やルールを作れば問題が解決するわけではなく、そこにエンジニアが見ているインターネットの形を反映していかないと良いルールにならないということです。そして、エンジニアは通信を維持することで社会的な責任を果たしているので、ネット社会の諸問題の解決にもエンジニアが知識を提供する必要があり、そこにエンジニアが貢献できるところはたくさんあると山下さんは訴えました。

海賊版対策の取り組みと課題

3番目の発表者は宮内秀輔さん(ヤフー)で、事業者で行っている海賊版対策と浮かび上がる課題、それを受けて技術検証チームがどのような取り組みをするかを説明しました。

まず日本の事業者が行っている海賊版対策として以下の4つを挙げました。

海賊版に関する検索を行うと注意啓発のバナーが表示される (出典:マンガ海賊版サイトの技術要素と対策法-当日資料)
  • 海賊版ではなく正規版コンテンツを利用するよう促す「STOP! 海賊版キャンペーン」を実施しています。海賊版に関係する検索をすると注意啓発のバナーを表示したり、直近では「転載はバカボン」という啓発マンガを制作しています。
  • セキュリティベンダー間で海賊版サイトのリストを共有しています。これを使って、海賊版サイトへのアクセスを抑止したり、リンク先が海賊版サイトであるという警告を出すなどの施策を行っています。
  • 検索事業者では海賊版サイトへの流入を抑止する対策を行っています。ヤフーでは法学有識者による会議の報告書をもとに一定基準で検索結果を非表示にしており、GoogleでもDMCA(米国の著作権法制度)に基づくページ非表示措置を実施しています。
  • 広告事業者でも海賊版サイトのリストを共有しています。これを使って、海賊版サイトの収入源となるような広告を出稿しないようにパトロールを行っています。

現在抱えている課題は、海賊版サイト運営者の特定と、海賊版サイトの停止の2つです。前者については、海賊版サイトの運営に使われるのは海外事業者が多く法的開示手続きが困難、開示されてもフリーメールの捨てアカウントを使っていて本人特定が困難といった問題があります。後者については、ミラーサイトを大量に作られてしまい差し止めが追いつかないとか、差し止め請求をしても裁判をしている間にドメインホッピング(ドメインの変更)されてしまい訴訟が無効になるといった状況です。

ドメインホッピングによる法的差し止め回避 (出典:マンガ海賊版サイトの技術要素と対策法-当日資料)

これらを踏まえて、技術検証チームでは海賊版サイトのインフラ調査と、海賊版サイトの同一性識別方法の検討を行っています。インフラ調査は、海賊版サイトが利用しているCDNサービスやドメインのレジストラ、オリジンサーバの所在や契約形態などを調べています。同一性調査は、裁判中にドメインホッピングされてしまう問題への対応として、ドメインを変更されても同一のサイトであるとわかるような識別方法を検討するものです。

実際に行っている作業は、whois、nslookup、digなどのコマンドを用いた調査、マルウェアなどの検査でよく使われるVirusTotalや、WebArchiveなどからわかるサイトの過去履歴の調査、海賊版サイトのHTMLやJavaScriptの解析、海賊版で利用されるインフラの試用などです。そして、それらの結果をMaltegoやPowerPointを使ってマインドマップを作ることを通じて可視化しています。

上記のスライドは可視化の例です。kaizoku1.comが2022年M月D日にkaizoku2.comにドメインホッピングし、レジストラも変更しています。しかしサイトのIPアドレスは変わっておらず、WebホスティングはC社を利用していることがわかります。

マンガ海賊版サイトとCDNの関係

最後の発表者は高見澤信弘さん(Jストリーム)で、マンガ海賊版サイトでCDNがどのように使われているかを解説しました。

マンガ海賊版サイトの規模 (出典:マンガ海賊版サイトの技術要素と対策法-当日資料)

CDNを使う利点は、コンテンツを高速に配信できることと、サーバを大量に設置して配信するのに比べて低コストで済むことです。マンガ海賊版サイトもコンテンツを配信するサイトなのでCDNが多用されています。発表で提示された海賊版サイトのCDN利用例では、月間の利用者数が1億8000万、流量が15.48PBと試算されています。これはCDNの利用者としてはかなり大規模です。この規模の配信をCDNを使わずに実施することはコスト的に到底見合わず、つまり不本意ながらマンガ海賊版サイトの配信をCDNが支えてしまっている状況です。

マンガ海賊版サイトのシステム構成 (出典:マンガ海賊版サイトの技術要素と対策法-当日資料)

サイトの基本構成は、マンガの画像ファイルが蓄積されたオリジンサーバ、ユーザにコンテンツを配信するCDN、負荷分散を行うGSLBからなります。特徴としては、ほとんどのサイトでWordPressが使われています。これはマンガ海賊版サイトのテンプレートがあることが予想され、それがWordPressを使う前提になっているものと推測されます。それから、キャッシュサーバはほぼ特定のCDN事業者が利用されています。これは無料で利用できる流量や機能が多いことと、利用者の身元確認が甘く、メールアドレスさえあれば契約できてしまうのが理由と考えられます。

マンガ海賊版サイトは画像の配信サイトなので動画サイトに比べて構成が簡単で、コンテンツ量も少なく(1サイトあたり10TB以下と推測される)、テンプレートを利用することで構築も容易ということで、1000サイト以上も乱立しているのはこのあたりにも原因がありそうです。

マンガ海賊版サイトにおけるCDNの制御例 (出典:マンガ海賊版サイトの技術要素と対策法-当日資料)

それから、マンガ海賊版サイトを解析する中で、CDNをかなり巧妙に使っていることもわかりました。JavaScriptのプログラムを作成し、画像ファイルへのアクセスを複数のCDNに分散するように制御しています。これは、複数のCDNを契約することでキャッシュ容量を拡大し、キャッシュヒット率を上げてオリジンサーバへのアクセスを減らすことや、CDNの無料枠をできるだけ使い切ることが目的だろうと推測しています。

参加者との議論

セッションの配信画面。右下が会場からの質問者。この他に配信視聴者を交えた議論がslackで行われていました

一連の発表の後、参加者との議論が行われました。

―― マンガ海賊版サイトは広告で収入を得ていますが、広告事業者への登録情報や銀行口座などで運営者の身元がわかったりしないのでしょうか?

石田:悪さをする広告事業者は国内ではありません。参考までに日本では広告事業者が訴訟で敗れて被害額の支払いを命じられた例があります(参考記事)。このようなサイト向けの広告事業者は海外にいるようで、そういうところを介していると予想されます。

―― 海賊版サイトはパッケージ化されているようですが、データとなるコンテンツも使い回されているのですか?

石田:過去のコンテンツに関しては、かなりの部分が使い回されているようです。最近のコンテンツは電子書籍から丸パクリをしているのではないかという情報もあります。電子書籍化は海賊版対策として推進された面もありますが、それが海賊版に悪用されているという問題も発生しています。

―― マンガ海賊版サイトによく利用されている特定のCDN事業者に対して日本の出版社が提訴していますが(参考記事)、裁判がどうなるのか予想を聞きたいです。

石田:裁判は司法の場ですが、行政でも立法でもこの問題は議論されていて、その積み重ねがある上で司法が判断するのだと思います。これまでの積み重ねがあるので、海賊版の抑止に向けて悪い方向に流れないことを期待しています。

山下:裁判とは別に、abuse担当としておかしいと思うことがあります。このCDN事業者は、自社が広報するIPアドレスで海賊版サイトを公開していますが、問い合わせをするとオリジンサーバの事業者名だけを返します(自社の情報は返さない)。そのため、例えばオリジンサーバの事業者名が弊社だと、弊社にクレームが来て、弊社がabuse対応することになります。本来はこのCDN事業者がやるべきことを肩代わりさせられています。インターネットの資源管理のルールに反していると思います。

宮内:日本では、プロバイダ制限法があって、プロバイダの自社のサービスを通じて万が一海賊版サイトのような違法な情報を発信してしまっていたとしても、申告を受けて対処すれば免責されるという規定があります。ところがかの企業は海賊版サイトとわかっていながら対処を行っていません。裁判においてどういう理論で「私達が今までやっていることは違法ではない」と説明するのか、個人的に注目しています。

高見澤:裁判がどうなるかは置いといて、事実上、海賊版サイトはCDNなしには成り立たないので、CDN事業者は「単純にインターネットという土管を使ってコンテンツを配信しているだけで何が流れているかは知りません」という言い逃れは難しいと思います。

―― この問題の根絶は難しいと思うんですが、どういう状況になったら技術的対策が十分だということになるんでしょうか?

石田:一番の問題は海賊版サイトが簡単に探せて見えてしまうことなので、まずはこれを防ぎたいです。そして、アクセスがゼロにならなくても、現状の1/10とか1/100に抑え込むことをまずは目指したいです。

―― 音楽の世界ではNapsterが出ましたが(著作権を無視したファイル交換ができて問題になった)、それをなくそうという努力よりもむしろ新しいサービス(iTunes)を出すことで上書きがなされました。マンガの世界では同じようにいかないのでしょうか?

石田:音楽の世界では、JASRACの存在があったりして、作者など権利者にお金を分配する仕組みができています。マンガもそういう世界に持っていきたいのですが、そこに至るにはまだ技術的なギャップや越えるべきハードルがあると理解しています。

おわりに

漫画村が問題になった当時は、政府がISPに漫画村へのアクセスを遮断するよう要請し、その是非が大きな議論になったことを記憶しています。その後、漫画村も閉鎖されて話を聞かなくなっていたので問題は鎮静化したのかと思っていたら当時よりもむしろ悪化・常態化していることを、このセッションに参加して知りました。

インターネットのサービスは国外の事業者も多く、また運営者も日本人・日本在住であるとは限らないため、各国の事情や法律などにも左右され、問題解決がより難しくなっているように見受けられます。しかし、そのような状況下でも、この問題の解決策を技術的に探ろうとする今回の取り組みは、とても価値あるものだと思いました。技術検証チームの取り組みが活用され、より有効な海賊版サイト対策となることを期待しています。