yura*'s rakugaki diary

つれづれなるままに、日くらし硯にむかひて、心にうつりゆくよしなし事を、そこはかとなく書きつくれば、あやしうこそものぐるほしけれ。

Doc2Vecによるブログ自動生成実験

ニコニコ動画でたまたま見た動画に触発されて、創作意欲がわいてきた。

 

www.nicovideo.jp

 

自然言語の解析は難しいイメージがあったが、現在はライブラリを利用することで、精度は今一だが、簡単に解析することができた。

 

taku910.github.io

 

目標はブログの文章を自動生成すること。

 

input:yura*'s rakugaki diary(このブログ)の全記事

output:ブログの文章と似た文章

 

中々うまくいかず。とりあえず、ブログのデータを収集することはできた。

 

いかんせん、データ量が少なすぎて学習がはかどらない。

 

品詞を抽出して、多用する構文に似せようとするも、選択する単語が少なすぎて文章が成立しない。

 

途中、ロロと雑巾がしっかり関連付いていて面白かった。もう少し遊んでみよう。

 

当ブログはAmazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。