{Python}MeCab

 

https://note.com/smkt_interview/n/nafebd60ae6bc
https://atmarkit.itmedia.co.jp/ait/articles/2102/05/news027.html


-- インストール

pip install mecab-python3
pip install unidic

python -m unidic download


-- 動作確認

import MeCab
import unidic


-- 分かち書き

wakati = MeCab.Tagger('-Owakati')

res = wakati.parse('顧客マスタ')
res
len(res.split() )
res.split()[0]
res.split()[1]

res = wakati.parse('注文明細テーブル')
res
len(res.split() )
res.split()[0]
res.split()[1]
res.split()[2]

res = wakati.parse('SKUマスタ')
res
len(res.split() )
res.split()[0]
res.split()[1]

res = wakati.parse('当月入金額')
res
len(res.split() )
res.split()[0]
res.split()[1]
res.split()[2]


-- 形態素解析

tagger = MeCab.Tagger()
res = tagger.parse('すももももももももものうち')
print(res)