2017年7月12日水曜日

いよいよ来週は中間発表です

作成したスライドについてまとめてみました。

スライドの修正

  1. 代表的なものだけでも別掲で拡大表示するなどして,P9をもっと見やすいように工夫してください。
  2. P15では,抄録の場合は50件ではなく200件の場合の結果を示してください。
  3. また,表(混同行列(Confusion Matrix))が薄くて見えにくいので,パワーポイントの表を使って書いてください。
  4. P12:異なる疾患名の検索で同じ抄録がヒットした場合,医学中央雑誌の「文献番号」で重複している抄録を除去したことを口頭でいいので言及してください。
  5. P20:現在,特徴量として使用している形態素の品詞を記入してください(「現在は,名詞,・・・・を使用」の・・・のところ)。
  6. なぜネット記事のほうが抄録を学習するよりも正確度が高くなったのか,原因を調査してください(コピ&ペで同じ文書が学習データになっちないか?)
  7. それを受けて,スマホアプリから入力する症状の候補を検討してください。

Q&A対策資料の作成

発表用のスライドとは別に,Q&A対策のスライドを作っておくと便利です。口頭ではなかなか伝わらないこともスライドを示しながら説明するとやりやすいです。
  1. 無作為に選んだ10病院の問診票をパワーポイントに貼り付ける
  2. 既存の女性健康アプリの一覧を作成する
  3. 収集した学習データのプロフィール(各疾患ごとの文書数,文字数)をまとめる
  4. KH Coderのベイズ学習の手順をまとめる
  5. ベイズ学習で選んだ品詞、除去した語(ストップワード)を一覧にする
  6. 交差検証テスト結果の混同行列にPrecisionとRecallを加える
  7. Kappa統計量についてまとめる

0 件のコメント:

コメントを投稿