こんにちは。内田勉(@sidodtv)です。
前の記事で告知したように、技研AIマーケット2に自動小説執筆AI Dragon Writerを出展しました。

前作の無限Writerは本を模していて、本を開くとiPadが出てきて数クリックの簡単な操作で小説が出来上がる、というのが特徴になっていました。
今回のDragon Writerは、ドラゴンが抱えている水晶玉を覗き込むと、ドラゴンがあなたの表情と心理状態を読み取って自動で小説ができあがる、という謎めいたキャッチコピーで説明していましたが、実際どのような仕組みになっていたのか、簡単に解説したいと思います。
Dragon Writerの仕組み
おおまかな動作の仕組みとしては、ドラゴンの後ろと僕の後ろに小型カメラが仕込んであり、写真を撮ってAIに表情や服装、持ち物などの認識を行わせて、その認識結果を元に短編小説を生成させています。


技術面では、まずはMacBook Airに接続されたカメラ2台分の動画を同時に撮影して、いったんMP4に保存。それを再度 YOLOv5に読み込んで、一番顔が良く写っているコマをjpegで切り出し。その後にLLMに画像認識を行わせて、顔の表情や持ち物などの情報をリストアップし、その情報を元に小説を執筆、イメージイラストを生成させPDFで出力。モバイルプリンタで印刷しています。
今回は誰でも手軽に小説を作れる事を優先したので、小説のストーリーは「主人公が不思議な剣を拾いドラゴンを倒す」という内容で固定し、追加で名前と性別、職業を手入力する程度に簡略化しました。
以下、サンプル小説です。
ころとろは、今日もまた、森の小道を散策していた。百年の時を生きながらも、その肌は瑞々しく、目立った皺一つない。健康的なオークル系の肌には自然な光沢があり、黒曜石のような瞳はどこか遠くを見つめ、口元には常に穏やかな微笑みが浮かんでいる。短く切り揃えられた黒髪のボブは、彼女の活動的ながらも優雅な印象を際立たせていた。普段着の黒いチュニックには〜〜
小説の冒頭には主人公の外見描写を入れるようにしたので、「自分が登場する小説」が必ず出来上がり、ありふれた設定の割になかなか評判は良かったです。
LLMは画像認識と小説生成にGemini-2.5-flash-preview-05-20、扉イラストの作成はDALL-Eを使っています。裏側ではOpenAIの4oも使えるように作ってあるのですが、動作が速いのでイベントではGeminiだけを使いました。

こちらのロゴはChatGPT 4oに作ってもらいました。ドルアーガの塔のロゴを読み込ませて「これをイメージしてDragon Writerのロゴを作って」と頼んだらこれが出来ました。
使用言語は PythonでCursor+Claude Sonnet4を使った100%バイブコーディングです。前回、無限Writerを作った時はVibe Codingなんて格好いい言葉はなく、「一発出し」とか呼んでいたので、時代が僕に追いついて良かったです。Sonnet4になってから格段に賢くなってコーディングがはかどりました。
ちなみに僕はPythonの言語仕様が全く分かりません。for文が普通の言語と違うので面倒くさくて覚えてないです。リストとかタプルとかあるのは知ってますが、よく分かりません。それでも1週間程度でちゃんと動くものが出来てしまったので、今後きちんとプログラミングの勉強をすべきか悩ましいです。
当日の様子
実は、ドラゴンと水晶玉(プラズマっぽい放射がある)は、単に注目を集めるためだけに使っていて、具体的な機能はありません。お客さんを自然な形で顔認識させるカメラに顔を近づけてもらう方法を考えた結果、こうなりました。LLMはAttentionが大事なのです。
(現代LLMの基礎となったAttention is all you needにちなんでこういう構成になってます、というのは冗談ですが)
当日はなかなかの混み具合。26人の方に体験していただきました。1人で2回やった人がいたので27冊の「自撮りAI小説」が生成されました。どれも「世界に1冊しかない自分だけの本」です。

知り合いの近藤祐子さんも来てくれました!
あと、隣にマッツさんが「絶対起こす!目覚ましエージェント」を出展してたので、一緒に記念写真撮っておけばよかった。
次は、技研AIマーケットの発展版? 「AIクリエイターズマーケット」が2025年11月8日(土)にあるので、そちらにも出展申し込みしようと思っています。会場はなんとベルサール秋葉原です! 次は当選するかな〜?

ちなみにチラシに僕ところとろさんもチラっと写ってるので探してみてね!
Dragon Writerで作成したサンプル小説は、こちらから読む事ができます!