yura*'s rakugaki diary

つれづれなるままに、日くらし硯にむかひて、心にうつりゆくよしなし事を、そこはかとなく書きつくれば、あやしうこそものぐるほしけれ。

Doc2Vecによるブログ自動生成実験

ニコニコ動画でたまたま見た動画に触発されて、創作意欲がわいてきた。

 

www.nicovideo.jp

 

自然言語の解析は難しいイメージがあったが、現在はライブラリを利用することで、精度は今一だが、簡単に解析することができた。

 

taku910.github.io

 

目標はブログの文章を自動生成すること。

 

input:yura*'s rakugaki diary(このブログ)の全記事

output:ブログの文章と似た文章

 

中々うまくいかず。とりあえず、ブログのデータを収集することはできた。

 

いかんせん、データ量が少なすぎて学習がはかどらない。

 

品詞を抽出して、多用する構文に似せようとするも、選択する単語が少なすぎて文章が成立しない。

 

途中、ロロと雑巾がしっかり関連付いていて面白かった。もう少し遊んでみよう。