学生募集

筑波大学 知識獲得システム研究室(加藤研究室)では,

  • 知識情報・図書館学類の3年生(卒業研究配属)
  • 博士課程前期
  • 博士課程後期

の学生を募集しています.

加藤研究室は

  • 筑波大学 宇陀研究室,松村研究室,小野研究室とゆるやかに連携しています.
  • 筑波大学 上保研究室,于研究室,早稲田大学 酒井研究室と定期的に研究会を行なっています.

目次

主な研究分野

本研究室では「情報検索分野」の下記の研究分野を主な対象としています:

  • 検索モデルとランキング
  • ランキング学習
  • 検索意図推定
  • 知識ベース構築
  • 知識ベース応用
  • Webマイニング
  • 情報抽出
  • 検索ユーザ行動分析
  • 検索ユーザモデリング
  • 推薦システム
  • オンライン評価

主な研究トピック

本研究室の主な研究トピックは「知識獲得システム」です:

  • 多くのリソースから知識を獲得するシステムを構築する
  • 知識を人が検索するためのシステムを構築する

重点テーマ(2023年現在)

本研究室の2023年現在の重点テーマは「汎用検索モデルと情報検索システム構築の自動化AutoIR」と「ドメイン特化検索アルゴリズム」です.以下に研究テーマの例を挙げます:

  • どのような検索サービスにも応用が可能な汎用ランキングモデルの構築
  • AutoMLの情報検索(IR)版であるAutoIRの開発
  • 「音楽業界は衰退しているか」「どの企業がブラック企業か」といった疑問に答えるために統計データを検索し根拠を用意する
  • 統計データから「2006年から○○の売り上げが伸びている」「茨城県南部では○○が増えている」といったように,自動的にそのデータを考察する文章を自動生成する
  • 情報格差をなくすための情報配信システムの構築

(注意: 基本的に上記のようなテーマを奨励しますが,特に博士課程後期の学生についてはこの限りではありません.また,適正・興味にあわせてテーマ設定も可能です)

必要知識

本研究室の研究テーマに取り組むに当たり下記の知識が必要となります:

  • 英語
  • 数学
    • 確率・統計
    • 線形代数
  • プログラミング
    • Python(別の言語でも良い)

(「数学」か「プログラミング」のどちらかが得意だとなお良い)

習得予定知識

本研究室の研究テーマに取り組むに当たり下記の知識が必要となりますので,配属されたばかりの人には勉強会にて基礎を学んでもらいます:

  • 情報検索(参考: 情報検索の基礎(共立出版))
    • 検索モデル(ブーリアンモデル,ベクトル空間モデル,確率モデル,言語モデル,深層学習による検索モデル)
    • Web検索(索引,クローリング,リンク解析)
    • 情報検索の評価(テストコレクションの構築方法,適合率・再現率,MAP,nDCG,ERR)
  • 自然言語処理(参考: 言語処理のための機械学習入門(コロナ社))
    • 上記の参考書で習得できる程度の基礎
  • 機械学習(参考: 言語処理のための機械学習入門(コロナ社),深層学習による自然言語処理(講談社))
    • 機械学習の基礎(教師あり学習,訓練データ,テストデータ,交差検証)
    • 代表的な機械学習モデル(線形回帰,ロジスティック回帰,SVM,決定木)
    • 深層学習
  • プログラミング
    • Python
  • Linuxの基本操作
    • cdやls,cpなどができれば良い

研究室の目標

  • 情報検索の専門家の輩出
    • 企業の検索システムの研究開発に携わるエンジニアとして活躍できる人材の輩出
    • 情報検索の研究者として国際的に活躍できる人材の輩出
  • 情報検索の研究拠点形成
    • 研究成果を継続的に発表することによって,国内および国外から「情報検索の研究をしている日本の研究室」と認識される
      • 上記の認識によって,卒業生や現役生の就職や転職の一助となることを期待
      • 上記の認識によって,情報検索の研究をしたい人が集まることを期待

研究室の年間予定(案)

  • 教科書輪講(3年生〜4年生,75分/週)
    • 情報検索の基礎(1月-2月)
    • 言語処理のための機械学習入門(3月-4月)
    • しくみがわかる深層学習(5月-6月)
  • プログラミング輪講(3年生〜4年生,75分/週)
    • 言語処理100本ノック
    • 実践的プログラミング(競技プログラミング・機械学習)
  • ゼミ(全員,75分/週)
    • 自分の近況や研究内容などを紹介
  • チームミーティング(全員,75分/週)
    • 3チームに分かれてチームごとにミーティング
  • 個別ミーティング(全員,60分/1~2週)
    • 基本的に1対1でのミーティング
  • 論文議論会(全員,75分/週)
    • 担当者が30分程度で1本の論文を紹介して残り時間で質問・議論する会
  • 国内学会発表(基本的に毎年みんなだそう)
    • 筑波大学 上保研究室,于研究室,早稲田大学 酒井研究室との合同研究会
  • 国際学会発表(卒業までに発表を目指そう)
    • SIGIR, TheWebConf, WSDM, CIKM, ECIR, ICTIR, CHIIR, WISE

Q&A

  • Q. コアタイムはありますか?
    • A. いいえ,設定する予定はありません.
  • Q. どのような人が向いていますか?
    • A. 下記のような人が向いていると思います.
      • たくさん研究をしたい人
      • 創造的なエンジニア職に就きたい人
      • 知識と技術を身につけて自信をつけたい人
      • 検索アルゴリズムの専門家になりたい人
      • 研究室のメンバーと協調して研究を進められる人
      • 英語が読めて,数学とプログラミングが得意な人
  • Q. どのような人は向いていませんか?
    • A. 下記のような人は向いていないと思います.
      • あまり研究をしたくない人
      • エンジニア職以外に就職したい人
      • 英語が嫌いな人
      • 数学「も」プログラミングも嫌いな人
  • Q. 博士課程前期への進学が推奨されますか?
    • A. はい.どんなに急いでも,研究室で身につけた知識や技術を発揮して就職活動に臨んだり,研究を行ったりするためには,1年以上の期間が必要となります.より具体的に言えば,勉強したり研究したりしても,その結果が生かされる頃には,メインの就職活動期間は終わっているでしょう.そのため,1年間のみ研究室に所属するのはあまりコストパフォーマンスがよくありません.特にこの分野では,博士課程前期への進学を前提にするのが費用対効果に優れると思います.
  • Q. 博士課程前期からでも入れますか?
    • A. はい.ただし,以下の条件を満たしている必要があります.
      • 「教科書輪講」相当の内容を勉強している
      • 「プログラミング輪講」相当の内容を勉強している
      • TOEIC 600点以上相当
  • Q. 博士課程後期からでも入れますか?
    • A. はい.社会人博士も歓迎です.ただし,以下の条件を満たしている必要があります.
      • 「Q. 博士課程前期からでも入れますか?」の条件を満たしている
      • コンピュータサイエンス系の論文をすでに執筆している