自然言語処理の現在地と未来 AIはヒトを惹きつける文章を執筆できるのか?

人間は言葉を通して知を蓄積してきました。世界中の言葉をAIが学習すれば、果たしてどのように役立つのでしょうか。今、注目されているAIの1つに、高度な自然言語処理が可能な「GPT-3」があります。本記事では、GPT-3によるブログ執筆実験を通してその可能性を紹介するとともに、ビジネスの現場におけるユースケースと利用時の注意点を解説します。

AIで高度化する自然言語処理

近年、AIの社会実装が急速に進み、私たちの生活においてAIは身近なものとなっています。例えば、ユーザーサポートにおけるチャットボットでの自動回答や、精度の高いQ&Aといった、言葉に関するコンテンツがあります。

言葉を扱う場合、一般的にNLPが用いられます。NLPとは、コンピュータで言葉を分析し、単語の出現頻度や出現確率などを用いて、言葉の持つ特徴を捉え、さまざまな言葉に関わるタスク処理を行うことです。

社会実装例として、分類、抽出、Q&A、検索が挙げられます。例えば分類では、商品説明からカテゴリに分類したり、ユーザーからの商品レビューをポジティブなものとネガティブなものに分類し業務にフィードバックしたりすることが考えられます。

また、AIによるNLPの現在地と将来について、次のように話します。

現在、社会実装が進んでいるもののほとんどは、特定のタスクに特化したAI、いわゆる特化型AIです。これは、ひとつのタスクにのみ特化しているため、弱いAIとも呼ばれます。一方、強いAIは、汎用的な課題解決が可能なAIを指します。より人間に近い振る舞いを目指していますが、私の知る限り、まだ世の中には存在しません。しかし、近い将来には誕生すると予測する学者もいます。

まだまだ強いAIと呼べるほど汎用的ではありませんが、NLPの未来への入り口となるAIに、GPT-3があります。日本経済新聞でも取り上げられるなど、メディアに登場する機会も増えています。

GPT-3によるブログ執筆実験

GPT-3の実力を試すべく、マクニカではGPT-3でブログを書く実験を行い、リクルーティング目的で公開しているブログ「ありマク」に掲載しました。このブログは、「マクニカニ」というキャラクターとマクニカ社員を想定した自称未来学者「G」との対談記事です。この「G」の記事をGPT-3で作成しました。


自然言語処理11.jpgブログ記事は当初、GPT-3を利用したことを伏せて公開していました


「G」には、「今後十年間の社会の重要な進展について、5点教えて欲しい」と問いかけました。その結果、GPT-3は「AIが、私たちの生活の一部となる」「生体工学の手足が手ごろな価格となり、ハンディキャップのある方の生活の質が向上する」「太陽光発電が、多くの国で標準となる」「ガジェットが、よりスマートで直感的になる」「環境の重要性を認識し、持続可能な未来のための必要なインフラ作成を開始する」の5点を挙げました。

さらに、5つ目の回答を深掘りするため、「持続可能な未来のために必要な、インフラストラクチャの作成を開始します」と問いかけたところ、「炭素排出量と汚染の削減」「グリーンエネルギーの促進」「廃棄物の削減」の3点が返ってきました。

まさに、GPT-3の出した回答の通りだと思いました。ブログに限らず、人間とGPT-3が共創して記事を創り出していくことは現実的に可能だと考えています。

なお、GPT-3への問いかけは英語で行い、回答を機械翻訳してから微修正し、日本語の記事にしました。GPT-3は日本語を扱うことができるのですが、日本語の学習量が少ないためか、マクニカが実験した限りにおいては、今のところ英語のほうが自然な回答になるようです。

GPT-3の利用例

では、具体的にGPT-3をどのように利用すればいいのでしょうか。「ありマク」の記事執筆を例に説明します。

最初に行うのは、タスクの説明です。例えば「あなたは優秀な未来学者です。これはあなたへのインタビューです。私の質問へのあなたの考えをお聞かせください。」というインプットを与えるとします。そして、質問である「今後10年間の、最も顕著な開発は何だと思うか、その理由と共に5点挙げて欲しい。」を続けます。深掘りした二つ目の質問についても同様の構成です。

その際、記述内容がとても重要で、アウトプットの精度に、直接的に影響してきます。いかに正確に、期待するアウトプットに導くように書くかがポイントになります。

次に、ソースコードについても解説しています。パラメータでは、より創造的な回答を期待するか、それとも創造的な点はある程度犠牲にして、より堅い回答、正確な回答を期待するかを設定できます。

これはブログの記事作成ですので、より創造的な回答を期待するように設定しています。GPT-3からのアウトプットは、創造的な設定であればあるほど、毎回異なった内容になります。今回は何度もトライして、良いと思ったものをピックアップして公開しました。


自然言語処理2.jpgプロンプトの入力は、実際にはPythonコードによって実現します

さまざまビジネスに適用可能なGPT-3

このように自然言語に近い回答を導き出すGPT-3ですが、ブログ以外にどのような分野で活用できるのでしょうか。

マクニカでは、チャットでの利用を想定してGPT-3に繰り返し問い合わせを行いました。今回は、日本語を直接入力しています。内容の真偽はともかく、それなりにきちんと会話が成り立っている点がポイントです。同じような内容を英語で問いかけると、もっと創造的な受け答えができるかもしれません。

自然言語処理3.jpgGPT-3は日本語にも対応していますが、現在は、英語のほうがよりよい回答が期待できます


次は、架空のボールペンとノートの商品広告を自動作成です。インプットするのは、タスクの説明に加えて、商品名、商品説明です。

ボールペンの商品名はSmothwriteです。o が一つ抜けていましたが、回答では o が補完されていました。商品説明では、まずこれが何であるかを明示しました。画像は入力として与えられていないので、ボールペンである事を言葉で認識させてあげる必要があります。

出力された広告文には、「書いた文字がきれいに見える」「カラーバリエーション豊富」「後戻りできない」など、商品説明には直接使っていない文が使用されています。

ソースコードでは、タスクの説明文として「以下商品をECサイト上に載せるためのクリエイティブな広告を書いてください」と指定しました。

創造性の設定は、チャットやブログに比べて控えめに設定しています。これにより、誇大広告が防げると考えています。


自然言語処理4.jpg創造性の設定を変えることによって、表現を豊かにするか正確性を高めるかを調節できます

GPT-3の安全性とリスク

GPT-3は、非常に強力ですが、それゆえに考慮しなければいけないポイントがあります。それは、「安全性」「有害性」「公平性」「堅牢性」の4点です。


自然言語処理5.jpg強力なAIは便利な反面、リスクが高く、扱いを誤らないように注意が必要

GPT-3の場合、リリースするにはOpenAI社の承認が必要で、承認プロセスを経ないでリリースしたものは、APIの利用停止措置など厳しい措置が課されます。

また、安全性とリスクを考慮したアプリケーションを開発するため、ユースケースのガイドラインが示されています。

低リスクなものは、常に承認されます。映画レビュー分類や情報抽出、計算、SQLクエリ生成、レシピ生成などは、低リスクユースケースに分類される傾向にあります。中リスクなものはケースバイケースです。ブログの作成、商品広告の作成などが相当します。ただし、アプリケーションではなく、ブログ記事へのスタティックな投稿は、自由に行ってよいことになっています。高リスクなものは、非常にセンシティブなユースケースで、ほとんど許可されません。SNSへの自動投稿が対象となるでしょう。

また、GPT-3は非常に強力で、汎用性の高い自然言語処理モデルです。多くの課題を、単一のモデルで解決することができます。リリースまでの期間を大幅に短縮できるため、NLPソリューション開発プロセスに革新を与えることになるでしょう。その反面、安全性とリスクを十分に考慮したアプリケーション開発が必要になります。

お問い合わせはこちら2.JPG

▼世界2.5万人のデータサイエンスリソースを活用したビジネス課題解決型のAIサービス
詳細はこちらからご覧頂けます。フルカスタマイズAIサービス CrowdANALYTIX

●CAXバナー.png