ガジェット

ChatGPT 開発の背後にはケニアの労働者による人力作業

注目を集める OpenAI の対話向け言語モデル ChatGPT だが、その開発には 1 時間 2 ドル以下で働くケニアの労働者が多数かかわっていたという
(TIME の記事
Windows Central の記事
The Register の記事)。

ChatGPT の前に OpenAI が開発した GPT-3 は高精度な文章生成能力を示していたが、学習に使用した素材の関係で一般的な使用に向かない有害なコンテンツを生成することもあった。このような失敗を繰り返さないためには、ヘイトスピーチや暴力、性的虐待といった有害なコンテンツを回避する AI が必要になる。そのため、OpenAIではインターネットのダークサイドから抽出した数万件のテキストスニペットへのラベル付けを米サンフランシスコの Sama とにアウトソーシングした。Sama はケニアやウガンダ、インドで労働者を雇い、IT 企業からの依頼を受けてデータにラベル付けを行う企業だ。

Sama は 2021 年 11 月から作業を開始したが、TIME がインタビューした Sama の従業員によれば暴力や性的虐待などを生々しく描いたテキストにラベル付けする作業は拷問のようだったという。2022 年 2 月には別プロジェクトとして性的および暴力的な画像を収集する作業のパイロットプログラムも開始したが、契約時に言及のなかった違法なコンテンツの収集を要求された Sama は作業を打ち切り、他のプロジェクトもすべて終了するとOpenAI に通告。同月、予定より早く契約を打ち切ることになった。

すべて読む

| デベロッパーセクション

| 人工知能

| デベロッパー
|
この記事をTwitterでつぶやく
この記事をFacebookで共有
この記事をGoogle Plusで共有
このエントリーをはてなブックマークに追加

関連ストーリー:

Stack OverflowがChatGPTによる回答を禁止、大量のもっともらしい回答に対処できず
2022年12月07日

複雑な問いかけにも回答するチャットAI「ChatGPT」がテスト公開
2022年12月05日

LinuxにAIを通してインタビューする試み
2022年10月03日

カーネギーメロン大学、オープンソースのコード生成AI「PolyCoder」
2022年03月11日

Microsoft、英語文章をプログラミング言語に変換する技術を「Power Apps」に追加へ
2021年05月27日

テキストから画像を生成するニューラルネットワーク「DALL·E」
2021年01月09日

朝日新聞社メディアラボ、機械学習モデルが自動生成したフィクション記事を公開
2020年11月21日

Source: スラッシュドット