Unicode周りのエラー取れなくて悩んでる。
#lucibot_dev
Conversation
Notices
-
Lucida@ちり紙 (lucida3rd@mstdn.lucida-memo.info)'s status on Saturday, 24-Nov-2018 15:41:19 JST Lucida@ちり紙
-
南あかねの外の人(雪餅) (yukimochi@toot.yukimochi.jp@toot.yukimochi.jp)'s status on Saturday, 24-Nov-2018 15:43:06 JST 南あかねの外の人(雪餅)
@lucida3rd Python 2系は、文字エンコード周り辛そう。。。
-
Lucida@ちり紙 (lucida3rd@mstdn.lucida-memo.info)'s status on Saturday, 24-Nov-2018 17:26:12 JST Lucida@ちり紙
結局、MeCabに出し入れするものはデコード、エンコードしないと通らない結論だった。?
MeCabはコンパイルオプションでutf-8にしたんだけどなぁ、それだと一部Unicodeのままに残るっぽい(詳しく見てないけど。
デコード、エンコード周りはJanomeのが手間かかんないかも。(=Janomeのままのがよかったにぇ...?? )
#lucibot_dev -
Lucida@ちり紙 (lucida3rd@mstdn.lucida-memo.info)'s status on Saturday, 24-Nov-2018 17:27:59 JST Lucida@ちり紙
@YUKIMOCHI 微妙に違うところがあって毎回ハマりますねぇ...?
-
Lucida@ちり紙 (lucida3rd@mstdn.lucida-memo.info)'s status on Saturday, 24-Nov-2018 17:31:50 JST Lucida@ちり紙
いちおMeCabのステータスを確認するコマンドだとutf-8なので。処理しなくてもこのまま行けると思い込んでた。
今回辞書がipadicなので、janomeより賢いらしいけどあんま差がわからんJ ?
#lucibot_dev
-