cucurbita

MeCab, CaboCha解析結果を分析するツール。

クラス構成

Install

git clone https://github.com/tomowarkar/cucurbita.git
pip install ./cucurbita

Usage

MeCab

import MeCab
from cucurbita.cab import Doc

m = MeCab.Tagger()
mecab_result = m.parse("隣の客はよく柿食う客だ。")
doc = Doc(mecab_result)
print(doc) 
#> 隣の客はよく柿食う客だ。

print(list(map(str, doc.tokenize())))
#> ['隣', 'の', '客', 'は', 'よく', '柿', '食う', '客', 'だ', '。']

print([token.surface for token in doc.tokenize() if token.pos in ["名詞"]])
#> ['隣', '客', '柿', '客']

CaboCha

import CaboCha
from cucurbita.cab import Sect

c = CaboCha.Parser()
cabocha_result = c.parse("隣の客はよく柿食う客だ。").toString(CaboCha.FORMAT_LATTICE)
sect = Sect(cabocha_result)
print(sect)
#> 隣の客はよく柿食う客だ。

print(list(map(str, sect.tokenize())))
#> ['隣', 'の', '客', 'は', 'よく', '柿', '食う', '客', 'だ', '。']

chunks = sect.chunks
chunk = chunks[0]
print(chunk)
#> 隣の

morphs = chunk.morphs
morph = morphs[0]
print(morph)
#> 隣

print(morph.surface, morph.pos, morph.pos1, morph.pos2, morph.pos3, \
      morph.conj_form, morph.conj, morph.base, morph.yomi, morph.pron)
#> 隣 名詞 一般 * * * * 隣 トナリ トナリ

文節情報の分析

def relations(sect):
  return [(c.pos, c.dst) for c in sect.chunks]
  
for pos, dst in relations(sect):
  # -1はかかり先なし
  if dst != -1:
    print("{} -> {}".format(sect.chunks[pos], sect.chunks[dst]))

def show_graph(sect):
  from pydot import Dot, Edge, Node
  graph = Dot(graph_type = 'digraph')

  for i, chunk in enumerate(sect.chunks):
      node = Node(i, label = str(chunk))
      graph.add_node(node)

  for i, chunk in enumerate(sect.chunks):
      if chunk.dst != -1:
          edge = Edge(i, chunk.dst)
          graph.add_edge(edge)

  from IPython.display import Image
  display(Image(graph.create(format='png')))

show_graph(sect)

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.circleci		.circleci
cucurbita		cucurbita
docs		docs
tests		tests
.gitignore		.gitignore
Pipfile		Pipfile
Pipfile.lock		Pipfile.lock
README.md		README.md
cucurbita.001.png		cucurbita.001.png
cucurbita.002.png		cucurbita.002.png
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

cucurbita

クラス構成

Install

Usage

MeCab

CaboCha

文節情報の分析

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

cucurbita

クラス構成

Install

Usage

MeCab

CaboCha

文節情報の分析

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages