検索と生成AI

何十年も前から人口頭脳という言葉はありましたが、SFかどこかで研究しているのだろうと言う程度の理解でしたが、数年前から現実の世界に取り入れられるようになって、いわゆるコンピューター業界が揺らぎ始めました。

大学生がレポート制作に使うと、その破綻ない文章処理能力と自然な文体に、教員は生成AIが作ったかどうか判断できなくなりました。

これが詐欺に使われると、これまでは日本語の稚拙な文章ですぐに偽物と判断できたのですが、文章だけでは本物と見分けがつかなくなって厄介な問題になっています。

最初のうちはまだまだ回答にばらつきがあったり、間違ったことを主張してきたり、その完成度に疑問を持ってまだまだ実用化には程遠いなどという意見もありましたが、1週間経てば別の新しいモデルが供用されるぐらい急速に進歩してきており、人間が行ってきたかなりの能力を追い越すのは時間の問題というより、すでにかなりの部分で抜かされております。

とは言っても、生成AIのモデルはインターネット上に存在する情報をかき集めているわけですから、確かにその中には誤った情報もたくさんあって、それ故に生成AIが間違うことも当然と言えば当然なわけです。

でここから本題になるのですが、基本的にインターネット上に構築されたウェブサイトは、おそらく検索サイトから誘導されてブラウザーで人間が直接見るわけですが、生成AIは検索とサイト閲覧の工程をすっ飛ばして結果だけを人々に回答することになります。

これはこれからの動向に依るところですが、検索より生成AIによるインターネットの情報収集が大勢を占めるようになってくると、ウェブサイトの作り方も変わらざるを得なくなります。

以前なら検索サイトの上位に表示される秘訣(SEO)などが流行りましたが、生成AIの受けが良いサイトの作り方というのが必要になってくるでしょう。

そこで問題になるのは、広告をどうやって差し込むかということです。

そこにもはや広告を入れる余地がなければ、生成AIの使用料という形で徴収することが考えられますが、その場合はサイトの制作者はどうやって広告料を手に入れるのでしょう?

生成AIがインターネットビジネスの根底から変えてしまうかもしれません。

スクレイピングで著作権違反

11月25日のニュースに、保育士向けの転職紹介サイトが、他社のサイトからスクレイピングによって大量のコメント欄の投稿を盗んでいたという記事がありました。

ご丁寧にクラウド上の業務日誌に詳細が記載されていたといいますから、犯罪と分かっていてやっているのは自明でしょう。

コメントならそもそも著作権で保護されないだろうとか、コピーライトマークがないサイトからしか取っていないとか、裁判になれば弁護士が入れ知恵しますから顛末は分かりませんが、日本人の法律を守る姿勢が怪しいのは確かです。

スクレイピングにとどまらず、インターネット上で情報があふれる昨今では、容易に文章や画像などをコピーすることができますから、技術的なハードルは下がるというよりないに等しいです。

そこでリテラシーとはマナーとかきれいごとで済まそうとしても、もとよりそれらのきれいな仕事のやり方は零細企業では推奨されておらず、効率を高めるためにはよそから盗んでくるのは褒められることはあっても怒られることはない。

自社で時間とお金をかけて一生懸命コメントを集めたところで、どうせ似たような内容しか集まりませんから、盗んだ方が簡単と思うのは当然かもしれません。コメントには価値がないと思っています。

ディジタルコピーに関しては、SDやDVDが普及しだした頃に議論の山がありましたが、小細工のような技術で逃げただけで、著作権についての議論はないままですから、リテラシー云々を今更問うても何も返ってこないでしょう。

今回のニュースは氷山の一角、やりたい放題のインターネットの世界が野放し状態です。