チームみらいでAIファクトチェッカー(以下チェッカー)を作った。
팀 미라이에서 AI 팩트 체커(이하 체커)를 만들었다.
偽情報という、世界中の民主主義を揺るがす大きな問題に何とかして対処し、少しでも世界の分断を回避するためだ。
거짓 정보라는, 전 세계 민주주의를 흔드는 큰 문제에 어떻게든 대처하고, 조금이라도 세계의 분단을 회피하기 위해서다.
公明党も利用を表明しているように、政党を横断して使うことが可能なツールであり、民主主義の質を向上させる可能性を秘める画期的なツールだと考えている。
공명당도 이용을 표명하고 있듯이, 정당을 횡단하여 사용할 수 있는 도구이며, 민주주의의 질을 향상시킬 가능성을 지닌 획기적인 도구라고 생각한다.
以下では、自己紹介、チェッカーを作った背景、チェッカーで何に対処しようとしているのか、技術的な説明、実際に動かしてどうだったか、今後どうしていくか、を書く。
이하에서는, 자기소개, 체커를 만든 배경, 체커로 무엇에 대처하려고 하는지, 기술적인 설명, 실제로 작동시켜 어떠했는지, 앞으로 어떻게 해나갈지, 를 쓴다.
僕は上座部仏教徒であり、政党やイデオロギーには興味がない。
나는 상좌부 불교도이며, 정당이나 이데올로기에는 관심이 없다.
生きとし生けるものの役に立てれば良い。
살아있는 모든 것에게 도움이 되면 좋다.
今回はチームみらいで開発するのが最も世の中の役に立つと思ったので参加しただけで、特定の政党に肩入れするつもりはない。
이번에는 팀 미라이에서 개발하는 것이 가장 세상에 도움이 된다고 생각했기 때문에 참가했을 뿐, 특정 정당을 편들 생각은 없다.
元々、世界に憎悪や分断が広がっていることを何とかしたいと思っていた。
원래, 세상에 혐오와 분단이 퍼져나가는 것을 어떻게든 하고 싶다고 생각했다.
この文章が載っているEvameというサイトも僕が開発した多言語ブログサイトで、ユーザーが書いた記事が自動で多言語に翻訳されるサイトなのだが、このサイトも知識や物語を世界的に共有することで分断を回避できるのではないかと思って開発している。
이 글이 실린 Evame라는 사이트도 내가 개발한 다국어 블로그 사이트로, 사용자가 쓴 기사가 자동으로 다국어로 번역되는 사이트인데, 이 사이트도 지식이나 이야기를 세계적으로 공유함으로써 분단을 회피할 수 있지 않을까 생각하며 개발하고 있다.
そんな中、安野さんからチェッカーの提案があり、たしかにこれは世の中の役に立ちそうだと思った。
그러던 중, 야스노 씨로부터 체커의 제안이 있었고, 확실히 이것은 세상에 도움이 될 것 같다고 생각했다.
また、以前仏教AIというパーリ三蔵の経蔵を元に回答するAIを作ったことがあったので、その経験を元にOpenAIのVectorStoreを使えばできるとわかっていたので開発を開始した。
또한, 이전 불교 AI라는 팔리어 삼장의 경장을 바탕으로 답변하는 AI를 만든 적이 있었기 때문에, 그 경험을 바탕으로 OpenAI의 VectorStore를 사용하면 할 수 있다는 것을 알고 개발을 시작했다.
想定どおり機能自体は2~3時間でできたが、XのAPIやGCPとの権限周りの認証と、精度を上げるためのプロンプトの調整で公開までは2~3日かかってしまった。余談だが、チームみらいはマジのスタートアップだったので、最初はこの辺の権限周りも安野さんがやっていた。
예상대로 기능 자체는 2~3시간 만에 만들었지만, X의 API나 GCP와의 권한 관련 인증과, 정확도를 높이기 위한 프롬프트 조정으로 공개까지는 2~3일 걸렸다. 여담이지만, 팀 미라이는 진짜 스타트업이었기 때문에, 처음에는 이 부분의 권한 관련도 야스노 씨가 하고 있었다.
SNSによる偽情報拡散の脅威は、既に大きな政治的リスクとなり、「認知戦」と呼ばれる新たな戦場になっている。
SNS에 의한 거짓 정보 확산의 위협은, 이미 큰 정치적 리스크가 되어, '인지전'이라고 불리는 새로운 전장이 되고 있다.
ルーマニアでは2024年の大統領選挙でインフルエンサーが外国に買収され、結果が不正に操作された疑いが大きいとして、実際に大統領選挙がやり直しになった。
루마니아에서는 2024년 대통령 선거에서 인플루언서가 외국에 매수되어, 결과가 부정하게 조작되었다는 의혹이 크다고 하여, 실제로 대통령 선거가 다시 치러졌다.
アメリカではSNSは憎悪をブーストする燃料となっていると言われ、政策の妥協が困難になり、暴力動員のリスクが持続していると言われている。
미국에서는 SNS는 혐오를 부추기는 연료가 되고 있다고 하며, 정책의 타협이 어려워지고, 폭력 동원의 위험이 지속되고 있다고 한다.
従来の人力による監視では、24時間体制でSNSをチェックすることは現実的に不可能だった。また、偽情報の流布から訂正までに不正確な情報が拡散する問題も深刻だ。チームみらいのファクトチェッカーは、この課題に即応する、具体的な解決策として開発された。
기존의 인력에 의한 감시로는, 24시간 체제로 SNS를 체크하는 것은 현실적으로 불가능했다. 또한, 거짓 정보의 유포부터 정정까지 부정확한 정보가 확산되는 문제도 심각하다. 팀 미라이의 팩트 체커는, 이 과제에 즉응하는, 구체적인 해결책으로 개발되었다.
このシステムは5つのステップで動く。
이 시스템은 5개의 단계로 작동한다.
マニフェスト等の信頼できる情報をシステムに登録
매니페스트 등의 신뢰할 수 있는 정보를 시스템에 등록
Twitter/X上で特定キーワード(ex. チームみらい、安野たかひろ)の投稿を自動収集
Twitter/X상에서 특정 키워드(ex. 팀 미라이, 야스노 타카히로)의 투고를 자동 수집
OpenAIのGPTとVerctorStoreを使用したRAGで、信頼できる情報と突き合わせて真偽判定
OpenAI의 GPT와 VerctorStore를 사용한 RAG로, 신뢰할 수 있는 정보와 맞춰 진위 판정
疑わしい情報を検出した場合、Slackに通知
의심스러운 정보를 검출했을 경우, Slack에 통지
人間が判断を行い、必要に応じて対応。
인간이 판단을 행하고, 필요에 따라 대응.
最終的な判断は人間が行うことが重要だ。AIはあくまで大量の情報を選別する役割を果たし、対応は人間が責任を持って行う。
최종적인 판단은 인간이 행하는 것이 중요하다. AI는 어디까지나 대량의 정보를 선별하는 역할을 수행하고, 대응은 인간이 책임감을 가지고 행한다.
オープンソースなので、もっと深く知りたい人は以下からコードを覗いてほしい。
오픈 소스이므로, 더 깊이 알고 싶은 사람은 이하에서 코드를 엿봐주길 바란다.
専門家の方から「当事者が行うものはファクトチェックとは言わない」との指摘があった。
전문가로부터 「당사자가 행하는 것은 팩트 체크라고 말하지 않는다」라는 지적이 있었다.
これはご指摘通りであり、その後名称をエビデンスチェッカーに変更することが決定した(選挙が忙しすぎてまだ諸々の設定変更はできていないが、、、、)。
이것은 지적대로이며, 그 후 명칭을 증거 체커로 변경하기로 결정했다(선거가 너무 바빠서 아직 여러 설정 변경은 되어 있지 않지만、、、、).
チームみらいはまだ知名度が高くなく、有名政党ほど偽情報は流れなかったので、効果は限定的だった。
팀 미라이는 아직 지명도가 높지 않고, 유명 정당만큼 거짓 정보는 흐르지 않았기 때문에, 효과는 제한적이었다.
チームみらいで動かしているチェッカーはあくまでチームみらいのマニフェスト等を元に調査するので、その他政党に対する情報は調査できないし、一般的な情報についても調査できない。これは何とかすべき課題だと考えている。
팀 미라이에서 작동시키고 있는 체커는 어디까지나 팀 미라이의 매니페스트 등을 바탕으로 조사하므로, 기타 정당에 대한 정보는 조사할 수 없고, 일반적인 정보에 대해서도 조사할 수 없다. 이것은 어떻게든 해야 할 과제라고 생각한다.
例えば台湾ではCofactsという公民連携ファクトチェック機関があり、AIと人間が協力してINEボット経由で1日3,000件の投稿をAI+人間がチェックする仕組みがある。
예를 들어 대만에서는 Cofacts라는 시민 연계 팩트 체크 기관이 있어, AI와 인간이 협력하여 INE 봇 경유로 1일 3,000건의 투고를 AI+인간이 체크하는 구조가 있다.
https://news.yahoo.co.jp/expert/articles/ea08db1d092604950430e920febc63682cd1b6b9
https://news.yahoo.co.jp/expert/articles/ea08db1d092604950430e920febc63682cd1b6b9
このような仕組みを日本でもやりたいと考えている。
이러한 구조를 일본에서도 하고 싶다고 생각하고 있다.
実際に分断を生んでいるのは、明確な偽情報というよりも悪意ある言及ではないかと思った。
실제로 분단을 낳고 있는 것은, 명확한 거짓 정보라기보다는 악의 있는 언급이 아닐까 생각했다.
これは定量的な分析ができているわけではないのではっきりとしたことは言えないが、実際に選挙中の言論を見ていると「〇〇は無能だ」とか「〇〇のせいで日本はだめになった」というような、明確に偽情報だと判断することはできない悪意のある言葉が多く飛び交っていた。今後の「認知戦」と呼ばれる領域では、このような言説に対抗することも必要だと考えている。
이것은 정량적인 분석이 되어 있는 것은 아니기 때문에 명확하게 말할 수는 없지만, 실제로 선거 중의 언론을 보고 있으면 「〇〇는 무능하다」든가 「〇〇 때문에 일본은 망했다」라는 것과 같은, 명확하게 거짓 정보라고 판단할 수 없는 악의 있는 말이 많이 오가고 있었다. 향후 「인지전」이라고 불리는 영역에서는, 이러한 언설에 대항하는 것도 필요하다고 생각하고 있다.
「認知戦」は、今回の選挙だけではなく、今後の国民生活に大きく影響する課題だ。
「인지전」은, 이번 선거뿐만 아니라, 향후 국민 생활에 크게 영향을 미치는 과제다.
選挙終了後はデジタル民主主義2030という枠組みでこれに対抗していきたい。
선거 종료 후에는 디지털 민주주의 2030이라는 틀에서 이에 대항해나가고 싶다.
具体的にどうしていくかについては白紙だが、台湾の事例を参考にすると、ミームによって悪意に対抗するのは筋がいいのではないかと考えている。
구체적으로 어떻게 해나갈지에 대해서는 백지이지만, 대만의 사례를 참고하면, 밈에 의해 악의에 대항하는 것이 합리적이지 않을까 생각하고 있다.
台湾では「humour over rumour(噂よりユーモア)」というアプローチで偽情報に対抗していて、例えば「トイレットペーパーがなくなる!」という噂が流れたとき、政府のスー首相が“お尻を振る”漫画を掲載し、お尻は1つ、買い占めても仕方ないというユーモアで偽情報に対抗した。
대만에서는 「humour over rumour(소문보다 유머)」라는 접근 방식으로 거짓 정보에 대항하고 있는데, 예를 들어 「화장지가 없어진다!」라는 소문이 돌았을 때, 정부의 쑤 총리가 “엉덩이를 흔드는” 만화를 게재하여, 엉덩이는 하나, 사재기해도 소용없다는 유머로 거짓 정보에 대항했다.
日本風に言えば「悪意より笑い」となるだろうか。
일본풍으로 말하면 「악의보다 웃음」이 될까.
もし笑いで世界を良くすることに興味がある人がいればデジタル民主主義2030に参加してほしい。エンジニアだけじゃなく、お笑い芸人や動画クリエイター等もいてくれると非常に助かる。
만약 웃음으로 세상을 좋게 하는 것에 관심이 있는 사람이 있다면 디지털 민주주의 2030에 참가해주길 바란다. 엔지니어뿐만 아니라, 코미디언이나 동영상 크리에이터 등도 있어주면 매우 도움이 된다.
ファクトチェック結果:❌ NG - 誤り: 「苫米地英人と安野貴博が元々一人の人間であった上に分裂した」という主張は、信頼できるデータソースや事実に基づく証拠が存在せず、誤りです。 - 正しい情報: Show more