筑波大学 知識獲得システム研究室(加藤研究室)では,
- 知識情報・図書館学類の3年生(卒業研究配属)
- 博士課程前期
- 博士課程後期
の学生を募集しています.
目次
主な研究分野
本研究室では「情報検索分野」の下記の研究分野を主な対象としています:
- 検索モデルとランキング
- ランキング学習
- 検索意図推定
- 知識ベース構築
- 知識ベース応用
- Webマイニング
- 情報抽出
- 検索ユーザ行動分析
- 検索ユーザモデリング
- 推薦システム
- オンライン評価
主な研究トピック
本研究室の主な研究トピックは「知識獲得システム」です:
- 多くのリソースから知識を自律的に獲得するシステムを構築する
- 簡単な研究テーマの例: テキストから「AならばBである」という関係を抽出する.
- 構造化された知識を人が検索するためのシステムを構築する
- 簡単な研究テーマの例: 人物検索,商品検索
重点テーマ(2020年現在)
本研究室の2020年現在の重点テーマは「データ検索」です.以下に研究テーマの例を挙げます:
- 「音楽業界は衰退しているか」「どの企業がブラック企業か」といった疑問に答えるために,Webから客観的な統計データを検索する
- グラフや統計データから「2006年から○○の売り上げが伸びている」「茨城県南部では○○が増えている」といったように,自動的にそのデータを考察する文章を自動生成する
- グラフや統計データから自動的にその内容を要約するようなグラフを生成する
- Webで公開されている表データなどを解析することによって,それらを知識として活用できるように変換し集積するシステムを構築する
- Webを徘徊して役に立つデータを自動的に集めてくるようなクローラを設計する
- TwitterやWeb検索エンジンのログなどから,明日の豆腐の消費量や筑波山の登山者数などを自動的に推定する
(注意: 基本的に上記のようなテーマを奨励しますが,特に博士課程後期の学生についてはこの限りではありません.また,適正・興味にあわせてテーマ設定も可能です)
必要知識(or 習得予定知識)
本研究室の研究テーマに取り組むに当たり下記の知識が必要となります(ので,配属されたばかりの人には勉強会にて基礎を学んでもらいます):
- 英語(例外的にこれだけは事前に必要,苦手でなければ良い)
- 数学
- 確率・統計
- 線形代数
- 情報検索(参考: 情報検索の基礎(共立出版))
- 検索モデル(ブーリアンモデル,ベクトル空間モデル,確率モデル,言語モデル,深層学習による検索モデル)
- Web検索(索引,クローリング,リンク解析)
- 情報検索の評価(テストコレクションの構築方法,適合率・再現率,MAP,nDCG,ERR)
- 自然言語処理(参考: 言語処理のための機械学習入門(コロナ社))
- 上記の参考書で習得できる程度の基礎
- 機械学習(参考: 言語処理のための機械学習入門(コロナ社),深層学習による自然言語処理(講談社))
- 機械学習の基礎(教師あり学習,訓練データ,テストデータ,交差検証)
- 代表的な機械学習モデル(線形回帰,ロジスティック回帰,SVM,決定木)
- 深層学習
- プログラミング
- Python(別の言語でも良い)
- Linuxの基本操作
- cdやls,cpなどができれば良い
(注意: 英語は必須ですが,それ以外はいくつかが得意である,または,得意になれれば良いです)
研究室の目標
- 情報検索の専門家の輩出
- 企業の検索システムの研究開発に携わるエンジニアとして活躍できる人材の輩出
- 情報検索の研究者として国際的に活躍できる人材の輩出
- 情報検索の研究拠点形成
- 研究成果を継続的に発表することによって,国内および国外から「情報検索の研究をしている日本の研究室」と認識される
- 上記の認識によって,卒業生や現役生の就職や転職の一助となることを期待
- 上記の認識によって,情報検索の研究をしたい人が集まることを期待
- 研究成果を継続的に発表することによって,国内および国外から「情報検索の研究をしている日本の研究室」と認識される
研究室の年間予定(案)
- 教科書輪講
- 情報検索の基礎(1月-2月)
- 言語処理のための機械学習入門(3月-4月)
- しくみがわかる深層学習(5月-6月)
- プログラミング輪講
- 言語処理100本ノック
- 実践的プログラミング(競技プログラミング・機械学習)
- ゼミ
- 自分の近況や研究内容などを紹介
- 研究ミーティング
- 基本的に1対1でのミーティング(Zoom等推奨)
- 論文議論会
- 45分程度その場で論文を読んで残り時間で議論する会
- 国際学会
- SIGIR(トップ国際会議)
- WSDM(ほぼトップ国際会議)
- CIKM(ややトップ国際会議)
- ECIR(中級国際会議)
- 国内学会
- DEIM(基本的にみんなだそう)
知識情報・図書館学類の3・4年生(卒業研究配属)
| 輪講(各週75分) | ゼミ(週75分) | 研究ミーティング(週30分-60分) | イベント | |
|---|---|---|---|---|
| 3年生 12月 | 教科書・プログラミング | ○ | ○ | |
| 1月 | 教科書・プログラミング | ○ | ○ | |
| 2月 | 教科書・プログラミング | ○ | ○ | |
| 3月 | 教科書・プログラミング | プロジェクト研究発表会 | ||
| 4年生 4月 | 教科書・プログラミング | ○ | ○ | |
| 5月 | 教科書 | ○ | ○ | |
| 6月 | 教科書 | ○ | ○ | 着手発表会 |
| 7月 | ○ | ○ | ||
| 8月 | ||||
| 9月 | ○ | ○ | ||
| 10月 | ○ | ○ | 中間発表会・ECIR締切 | |
| 11月 | ○ | ○ | ||
| 12月 | ○ | ○ | ||
| 1月 | ○ | ○ | 卒論発表会・SIGIR締切 | |
| 2月 | ○ | ○ | DEIM締切 | |
| 3月 | DEIM発表 |
博士課程前期
| 研究紹介(週75分) | 論文議論会(週75分) | 研究ミーティング(週30分-60分) | イベント | |
|---|---|---|---|---|
| 1年生 4月 | ○ | ○ | ○ | |
| 5月 | ○ | ○ | ○ | CIKM締切 |
| 6月 | ○ | ○ | ○ | 着手発表会 |
| 7月 | ○ | ○ | ○ | |
| 8月 | インターンシップ・WSDM締切 | |||
| 9月 | インターンシップ | |||
| 10月 | ○ | ○ | ○ | 前半発表会1・ECIR締切 |
| 11月 | ○ | ○ | ○ | |
| 12月 | ○ | ○ | ○ | |
| 1月 | ○ | ○ | ○ | 前半発表会2・SIGIR締切 |
| 2月 | ○ | ○ | ○ | DEIM締切 |
| 3月 | 就職活動 |
| 研究紹介(週75分) | 論文議論会(週75分) | 研究ミーティング(週30分-60分) | イベント | |
|---|---|---|---|---|
| 2年生 4月 | 就職活動 | |||
| 5月 | 就職活動・CIKM締切 | |||
| 6月 | ○ | ○ | ○ | |
| 7月 | ○ | ○ | ○ | 中間発表会 |
| 8月 | ○ | ○ | ○ | WSDM締切 |
| 9月 | ○ | ○ | ○ | |
| 10月 | ○ | ○ | ○ | ECIR締切 |
| 11月 | ○ | ○ | ○ | |
| 12月 | ○ | ○ | ○ | |
| 1月 | ○ | 最終発表会・SIGIR締切 | ||
| 2月 | ○ | DEIM締切 | ||
| 3月 |
博士課程後期
自由
Q&A
- Q. コアタイムはありますか?
- A. いいえ,設定する予定は今のところありません.
- Q. どのような人が向いていますか?
- A. 下記のような人が向いていると思います.
- 研究をしたい人
- 創造的なエンジニア職に就きたい人
- 知識と技術を身につけて自信をつけたい人
- 賢いシステムを作ってみたい人
- 検索に詳しくなりたい人
- 英語が嫌いではなく,かつ,数学「か」プログラミングが嫌いではない人
- A. 下記のような人が向いていると思います.
- Q. どのような人は向いていませんか?
- A. 下記のような人は向いていないと思います.
- 研究をしたくない人
- エンジニア職以外に就職したい人
- 英語が嫌いな人
- 数学「も」プログラミングも嫌いな人
- A. 下記のような人は向いていないと思います.
- Q. 博士課程前期への進学が推奨されますか?
- A. はい.どんなに急いでも,研究室で身につけた知識や技術を発揮して就職活動に臨んだり,研究を行ったりするためには,1年以上の期間が必要となります.より具体的に言えば,勉強したり研究したりしても,その結果が生かされる頃には,メインの就職活動期間は終わっているでしょう.そのため,1年間のみ研究室に所属するのはあまりコストパフォーマンスがよくありません.特にこの分野では,博士課程前期への進学を前提にするのが費用対効果に優れると思います.
- Q. 博士課程前期からでも入れますか?
- A. はい.ただし,以下の条件を満たしている必要があります.
- 「教科書輪講」相当の内容を勉強している
- 「プログラミング輪講」相当の内容を勉強している
- TOEIC 600点以上相当
- A. はい.ただし,以下の条件を満たしている必要があります.
- Q. 博士課程後期からでも入れますか?
- A. はい.社会人博士も歓迎です.ただし,以下の条件を満たしている必要があります.
- 「Q. 博士課程前期からでも入れますか?」の条件を満たしている
- コンピュータサイエンス系の論文をすでに執筆している
- A. はい.社会人博士も歓迎です.ただし,以下の条件を満たしている必要があります.