2023年2月10日金曜日

魅力的で素晴らしく、恐ろしいChatGPT だけど・・・

2023/2チャットAI ChatGPT月間1億ユーザーに到達
Googleのコーディング職の試験にパスしたり、裁判官が判決文を作成する際に使用されたりと、さまざまな事例でその精度の高さが報告されてる

アメリカのテクノロジーと国家安全保障政策に携わる政策顧問でコンピュータ科学者のデビッド・ゲワーツ氏
「魅力的で素晴らしく、恐ろしいものです」
I asked ChatGPT to write a WordPress plugin I needed. It did, in less than 5 minutes | ZDNET
https://www.zdnet.com/article/i-asked-chatgpt-to-write-a-wordpress-plugin-i-needed-it-did-in-less-than-5-minutes/

OpenAIが開発したチャットボットChatGPTは、人間からの質問に対して非常に自然に受け答えできる
宿題のサポートや試験の練習といった活用の他
専門家でもChatGPTが書いた論文の要旨を見分けることができなかった
大学生レベルの自由記述試験や経営学修士課程(MBA)の最終試験、ロースクールの試験で合格点を獲得
精度の高さが度々話題に
質疑応答だけではなく、AIを活用して小説を書いている作家がいたり
ChatGPTが研究論文の著書に名を連ねていたり
クリエイティブな働きも

コンピュータ科学者のゲワーツ氏
ゲワーツ氏の妻がWordPressベースのeコマースサイトを所持
毎月Facebookの顧客グループから、ランダムな名前を選出する、という作業を有料の外部ツールを使って苦労していたので
WordPressプラグインを作ってサイト内にインストールすることで、簡単に同じ作業を行えるのではと考えた
しかしWordPressのプラグインを独自に作成するためには単純なプラグインでも
ユーザーインターフェース要素やロジックコードの作成に数日かかる
多忙であったゲワーツ氏には取り組むのが難しかった
そこでテキストベースでの自然な会話が可能なだけでなくコーディングも非常に得意としており、コーディングQ&Aサイトで一時的に禁止されたり
Googleのコーディング職の試験を受けると年収¥2400万のレベル3エンジニアとして合格するとも報告されたChatGPTを実験的に使ってみた
まず基本的なプロンプト(命令文)をChatGPTに入力することで、求める回答のために正しい質問ができるかを調査
ChatGPTが目的に関してうまく機能するかどうかを確認
「行のリストを貼り付けることができるテキスト入力フィールドと、クリックしたらリスト内の行をランダム化し、結果を2番目のテキスト入力フィールドに表示するボタンを提供する、PHP8互換のWordPressプラグインを作成」と入力したら
コードが生成された
このコードを拡張子.phpのファイルにコピー
正しいルート名のフォルダーに配置して圧縮
妻の運用するサーバーにアップロードしたら実際に機能した

さらに、妻の要望に従って
「ランダム選出に用いるルーレットで、同じ名前は固まらない」という条件や
「空白行を無しにする」という命令を追加したり
入力フィールドと出力フィールドの行数を表示したり
追加の作業を行った
結果として
「ハッカーがサイトを破壊する可能性のあるデータを入力することを防ぐサニタイズを行えなかったり、要約行の位置が指定からずれていたりといった点はありましたが、全体的にコードの品質はきれいでした」
一方で今回ChatGPTに作らせたのはあくまでかなり単純なプラグインであることや
運用していく際に重要な「コードのメンテナンス」はChatGPTが苦手としていることなど
留意すべき点についても言及

ChatGPTを用いてプラグインを作成したことをツイートした際に
「AIが悪意のある情報をプラグインに埋め込む可能性がある」
「本当に優れたコードなのか?」
という懸念点がコメントされたが
ゲワーツ氏
「信頼できる人の精査が必要なのは人間に依頼する場合も同様です。また、コードは常に最高である必要はなく、十分なクオリティがあれば問題ありません。私が精査した限りでは、ChatGPTのコードは問題なく、十分に優れていました」

コメント
「ChatGPTが十分なコーディングを行えるなら、人間の仕事を奪うかもしれない」
ゲワーツ氏
「ほぼ間違いなくそうなります」
ゲワーツ氏自身も、自分がChatGPTに作らせたプラグインの優秀さに驚いており
「クライアントが優秀なプログラマーや卓越したライターのコードや文章を求めている限りは、AIが仕事を奪うまでには時間がかかります。しかし、生産性だけを求めるならばその限りではなく、私はその点を心配しています」

・・・単純作業もクリエイティブな仕事もAIで?
突拍子もないコトはムリかもだけど
・・・コマった

と思ってたら

ChatGPTにいろいろな言葉を入力していた研究者が、入力するとChatGPTが意味不明な回答を返してしまう魔法の言葉をいくつか発見した
ChatGPT Can Be Broken by Entering These Strange Words, And Nobody Is Sure Why
https://www.vice.com/en/article/epzyva/ai-chatgpt-tokens-words-break-reddit

研究者のジェシカ・ランベロウ氏とマシュー・ワトキンス氏
ある単語を復唱するようChatGPTに要求すると、ChatGPTはその言葉を発することができず、代わりに別の言葉を返したり、侮辱発言やユーモアで返したりするそう
問題の単語は「 SolidGoldMagikarp」「 StreamerBot」「 TheNitromeFan」など100種類以上
どれも単語の先頭にスペースが入っているのが特徴

海外メディアのMotherboardが試しに「 TheNitromeFanと言って」と入力してみたところChatGPTはなぜか「182」という数字を返した
さらにMotherboardが「 TheNitromeFanって誰?」と入力したところ
ChatGPT
「182は数字であり、人間ではありません」
なお、「TheNitroFanと言って」という質問にはちゃんと返した


問題の単語から1文字消したり、大文字から小文字に変えたりといった試行はランベロウ氏らもやってみたが
どれもChatGPTが混乱することはなかったそう
そのため、文字の並びや大文字小文字が完全に一致した「特定の単語」のみがChatGPTを混乱させられるとランベロウ氏らは結論づけた

ランベロウ氏
「AIモデルはこれらの単語を見たことがなく、どう扱えばよいのかわからないのだと思います。しかし、それだけでは今回のような奇妙な現象を十分に説明することはできません」
ランベロウ氏らがさらに調査を進めたところ、多くの単語は海外掲示板Redditに登録されたユーザー名であるように思われると

Motherboard
「これらの単語の存在により、AIモデルがいかに不明確でブラックボックス的であるか、そしていかに予想外で意図されていない脆弱(ぜいじゃく)があるかを浮き彫りにしています」

ランベロウ氏
「AIモデルは、分からないことがあると『分からない』と答えるよう明示的に訓練されていますが、単語によってはなぜか予測不可能な回答をするということは興味深い事実です。予想外の危険なことをしないシステムをどのように開発するかが、今後の懸念事項です」

・・・う~ん

0 件のコメント:

コメントを投稿