AI小説を創作するために、我々がトライした作業について少しご紹介します。
小説を書かせるためには、その前提として、小説とはどういうものなのかをAIに理解させなければなりません。今後、数百~数千の小説を学習させることになりますが、データセットの方法を間違うと満足できるアウトプットにはなりません。さらに言えば、ここで間違うと取り返しのつかない結果ともなるのです。
最も初期の作業として、AIがどれほど小説を理解できるのか、理解させるためのデータ付与はどのようにすべきかを検証しました。
上の図はそのプロセスを示したものです。
左側の矢印は自然言語理解のためのデータを付与していることを示し、右側の矢印は実際にセレクトした小説作品『象の消滅』(村上春樹著)をデータとして学習させていることを示しています。
学習を繰り返した結果、AIが『象の消滅』を理解しているのかどうか、計59の質問を投げかけ、検証しました。
第1回目の検証では、正答率が20%ほどだったのですが、データセットと学習の方法に改善を加え、最終的には80%の正答率まで高めることができました。
ここで想像もしなかった結果も出ました。
正答率20%が80%になるまでに、わずか1日半の時間しか要していないのです。
また、一般常識的な質問に答えられない一方で、非常に抽象的な質問に対しても正解を導き出しています。
まさに人工「知能」であることを実感した瞬間でもあります。
次回は、AIの答えた内容についてご紹介します。