数日前に形態素解析を使ったアイデアを思いつき、
ここ数日、形態素解析や機械学習について調べてました。
まさかこのタイミングで機械学習に触れるとは思いませんでしたが、
良い機会なので少しやってみようかなと思います。
以下はその調べる過程で分かったことのメモです。(備忘録的な)
* 形態素解析や機械学習はPythonじゃなくても出来る
* MeCab等の形態素解析ライブラリ以外にも各言語に対応したライブラリやOSSは数多く存在する
* 形態素解析用の辞書データは初期状態でもある程度解析出来る
* 固有名詞等はある程度辞書に追加/更新していかないと解析が難しい
* ハッシュタグやアカウントの接頭辞(#、@)やメールアドレス、URL等の解析に不要な項目は排除した方が良い
* 形態素解析だけでは文書の自動作成は出来ないが、文書フォーマットを指定すれば文書の自動生成もある程度は可能