学生募集

筑波大学 情報学群 知識情報・図書館学類/図書館情報メディア研究科 知識獲得システム研究室(加藤 誠 研究室)では,

  • 知識情報・図書館学類の3年生(卒業研究配属)
  • 博士課程前期
  • 博士課程後期

の学生を募集しています.

目次

主な研究分野

本研究室では「情報検索分野」の下記の研究分野を主な対象としています:

  • 検索モデルとランキング
  • ランキング学習
  • 検索意図推定
  • 知識ベース構築
  • 知識ベース応用
  • Webマイニング
  • 情報抽出
  • 検索ユーザ行動分析
  • 検索ユーザモデリング

主な研究トピック

本研究室の主な研究トピックは「知識獲得システム」です:

  • 多くのリソースから知識を自律的に獲得するシステムを構築する
    • 簡単な研究テーマの例: テキストから「AならばBである」という関係を抽出する.
  • 構造化された知識を人が検索するためのシステムを構築する
    • 簡単な研究テーマの例: 人物検索,商品検索

重点テーマ(2019年現在)

本研究室の2019年現在の重点テーマは「データ検索」です.以下に研究テーマの例を挙げます:

  • 「音楽業界は衰退しているか」「どの企業がブラック企業か」といった疑問に答えるために,Webから客観的な統計データを検索する
  • グラフや統計データから「2006年から○○の売り上げが伸びている」「茨城県南部では○○が増えている」といったように,自動的にそのデータを考察する文章を自動生成する
  • グラフや統計データから自動的にその内容を要約するようなグラフを生成する
  • Webで公開されている表データなどを解析することによって,それらを知識として活用できるように変換し集積するシステムを構築する
  • Webを徘徊して役に立つデータを自動的に集めてくるようなクローラを設計する
  • TwitterやWeb検索エンジンのログなどから,明日の豆腐の消費量や筑波山の登山者数などを自動的に推定する

(注意: 基本的に上記のようなテーマを奨励しますが,特に博士課程後期の学生についてはこの限りではありません.また,適正・興味にあわせてテーマ設定も可能です)

必要知識(or 習得予定知識)

本研究室の研究テーマに取り組むに当たり下記の知識が必要となります(ので,配属されたばかりの人には勉強会にて基礎を学んでもらいます):

  • 英語(例外的にこれだけは事前に必要,苦手でなければ良い)
  • 数学
    • 確率・統計
    • 線形代数
  • 情報検索(参考: 情報検索の基礎(共立出版))
    • 検索モデル(ブーリアンモデル,ベクトル空間モデル,確率モデル,言語モデル,深層学習による検索モデル)
    • Web検索(索引,クローリング,リンク解析)
    • 情報検索の評価(テストコレクションの構築方法,適合率・再現率,MAP,nDCG,ERR)
  • 自然言語処理(参考: 言語処理のための機械学習入門(コロナ社))
    • 上記の参考書で習得できる程度の基礎
  • 機械学習(参考: 言語処理のための機械学習入門(コロナ社),深層学習による自然言語処理(講談社))
    • 機械学習の基礎(教師あり学習,訓練データ,テストデータ,交差検証)
    • 代表的な機械学習モデル(線形回帰,ロジスティック回帰,SVM,決定木)
    • 深層学習
  • プログラミング
    • Python(別の言語でも良い)
  • Linuxの基本操作
    • cdやls,cpなどができれば良い

(注意: 英語は必須ですが,それ以外はいくつかが得意である,または,得意になれれば良いです)

研究室の目標

  • 情報検索の専門家の輩出
    • 企業の検索システムの研究開発に携わるエンジニアとして活躍できる人材の輩出
    • 情報検索の研究者として国際的に活躍できる人材の輩出
  • 情報検索の研究拠点形成
    • 研究成果を継続的に発表することによって,国内および国外から「情報検索の研究をしている日本の研究室」と認識される
      • 上記の認識によって,卒業生や現役生の就職や転職の一助となることを期待
      • 上記の認識によって,情報検索の研究をしたい人が集まることを期待

研究室の年間予定(案)

  • 教科書輪講
    • 情報検索の基礎(12月-1月)
    • 言語処理のための機械学習入門(2月-3月)
    • 深層学習による自然言語処理 輪講(4月-5月)
  • プログラミング輪講
    • Python・Linuxの基本操作
  • 研究紹介
    • 自分の研究内容や読んだ論文,近況・趣味などを紹介
  • 研究ミーティング
    • 基本的に1対1でのミーティング(Skype等可)
  • 論文議論会
    • 45分程度その場で論文を読んで残り時間で議論する会
  • 国際学会
    • SIGIR(トップ国際会議)
    • WSDM(ほぼトップ国際会議)
    • CIKM(ややトップ国際会議)
    • ECIR(中級国際会議)
  • 国内学会
    • DEIM(基本的にみんなだそう)

知識情報・図書館学類の3・4年生(卒業研究配属)


輪講(各週75分)研究紹介(週75分)研究ミーティング(週30分-60分)イベント
3年生 12月教科書・プログラミング
1月教科書・プログラミング
2月教科書・プログラミング
3月教科書・プログラミング

プロジェクト研究発表会
4年生 4月教科書
5月教科書
6月着手発表会
7月

8月



9月

10月
中間発表会・ECIR締切
11月

12月

1月
卒論発表会・SIGIR締切
2月
DEIM締切
3月



博士課程前期


研究紹介(週75分)論文議論会(週75分)研究ミーティング(週30分-60分)イベント
1年生 4月
5月CIKM締切
6月
7月
8月


インターンシップ・WSDM締切
9月


インターンシップ
10月ECIR締切
11月
12月
1月SIGIR締切
2月DEIM締切
3月


就職活動

研究紹介(週75分)論文議論会(週75分)研究ミーティング(週30分-60分)イベント
2年生 4月


就職活動
5月


就職活動・CIKM締切
6月
7月中間発表会
8月WSDM締切
9月
10月ECIR締切
11月
12月
1月

最終発表会・SIGIR締切
2月

DEIM締切
3月



博士課程後期

自由

Q&A

  • Q. コアタイムはありますか?
    • A. いいえ,設定する予定は今のところありません.
  • Q. どのような人が向いていますか?
    • A. 下記のような人が向いていると思います.
      • 研究をしたい人
      • 創造的なエンジニア職に就きたい人
      • 知識と技術を身につけて自信をつけたい人
      • 賢いシステムを作ってみたい人
      • 検索に詳しくなりたい人
      • 英語が嫌いではなく,かつ,数学「か」プログラミングが嫌いではない人
  • Q. どのような人は向いていませんか?
    • A. 下記のような人は向いていないと思います.
      • 研究をしたくない人
      • エンジニア職以外に就職したい人
      • 英語が嫌いな人
      • 数学「も」プログラミングも嫌いな人
  • Q. 博士課程前期への進学が推奨されますか?
    • A. はい.どんなに急いでも,研究室で身につけた知識や技術を発揮して就職活動に臨んだり,研究を行ったりするためには,1年以上の期間が必要となります.より具体的に言えば,勉強したり研究したりしても,その結果が生かされる頃には,メインの就職活動期間は終わっているでしょう.そのため,1年間のみ研究室に所属するのはあまりコストパフォーマンスがよくありません.特にこの分野では,博士課程前期への進学を前提にするのが費用対効果に優れると思います.
  • Q. 博士課程前期からでも入れますか?
    • A. はい.ただし,以下の条件を満たしている必要があります.
      • 「教科書輪講」相当の内容を勉強している
      • 「プログラミング輪講」相当の内容を勉強している
      • TOEIC 600点以上相当
  • Q. 博士課程後期からでも入れますか?
    • A. はい.社会人博士も歓迎です.ただし,以下の条件を満たしている必要があります.
      • 「Q. 博士課程前期からでも入れますか?」の条件を満たしている
      • コンピュータサイエンス系の論文をすでに執筆している