注目を集める OpenAI の対話向け言語モデル ChatGPT だが、その開発には 1 時間 2 ドル以下で働くケニアの労働者が多数かかわっていたという
(TIME の記事、
Windows Central の記事、
The Register の記事)。
ChatGPT の前に OpenAI が開発した GPT-3 は高精度な文章生成能力を示していたが、学習に使用した素材の関係で一般的な使用に向かない有害なコンテンツを生成することもあった。このような失敗を繰り返さないためには、ヘイトスピーチや暴力、性的虐待といった有害なコンテンツを回避する AI が必要になる。そのため、OpenAIではインターネットのダークサイドから抽出した数万件のテキストスニペットへのラベル付けを米サンフランシスコの Sama とにアウトソーシングした。Sama はケニアやウガンダ、インドで労働者を雇い、IT 企業からの依頼を受けてデータにラベル付けを行う企業だ。
Sama は 2021 年 11 月から作業を開始したが、TIME がインタビューした Sama の従業員によれば暴力や性的虐待などを生々しく描いたテキストにラベル付けする作業は拷問のようだったという。2022 年 2 月には別プロジェクトとして性的および暴力的な画像を収集する作業のパイロットプログラムも開始したが、契約時に言及のなかった違法なコンテンツの収集を要求された Sama は作業を打ち切り、他のプロジェクトもすべて終了するとOpenAI に通告。同月、予定より早く契約を打ち切ることになった。
| 人工知能
| デベロッパー
|
関連ストーリー:
Stack OverflowがChatGPTによる回答を禁止、大量のもっともらしい回答に対処できず
2022年12月07日
複雑な問いかけにも回答するチャットAI「ChatGPT」がテスト公開
2022年12月05日
LinuxにAIを通してインタビューする試み
2022年10月03日
カーネギーメロン大学、オープンソースのコード生成AI「PolyCoder」
2022年03月11日
Microsoft、英語文章をプログラミング言語に変換する技術を「Power Apps」に追加へ
2021年05月27日
テキストから画像を生成するニューラルネットワーク「DALL·E」
2021年01月09日
朝日新聞社メディアラボ、機械学習モデルが自動生成したフィクション記事を公開
2020年11月21日
Source: スラッシュドット