方法:収集データ、使用したソフト等についてはこちらを参照。
条件:疾患名をそのまま特徴語とさせないため、ストップワードを設けた。
~ストップワード一覧~
子宮筋腫
子宮頸がん
子宮頸癌
子宮体癌
子宮体がん
子宮内膜症
卵巣腫瘍
子宮
体
膜
頸
卵巣
腫瘍
筋腫
癌
がん
~~~~~~~~~~~
品詞の限定は今回しておらず、全品詞を指定した。
各疾患10件 |
各疾患20件 |
各疾患30件 |
各疾患40件 |
各疾患50件 |
各件数ごとの推移 |
件数を増やしていくごとに結果が良くなっていることがわかる。
今後は各疾患のすべてのデータを用い、検証したい。
また、品詞の指定をすることでどう結果が変わるかも検証したい。
0 件のコメント:
コメントを投稿