English CV

Masatoshi Suzuki

鈴木正敏(すずき・まさとし)

東北大学 大学院情報科学研究科 乾・鈴木研究室 博士後期課程学生
東北大学 学際高等研究教育院 博士研究教育院生
日本学術振興会 特別研究員 DC2
理化学研究所 革新知能統合研究センター 言語情報アクセス技術チーム 研修生

研究内容

専門は自然言語処理。学部4年(2015年)より、固有表現分類、質問応答システムの研究に取り組む。現在は主に、クイズ問題を利用した言語理解システムの開発・評価について研究中。

略歴

2019/05–現在: 理化学研究所 革新知能統合研究センター 言語情報アクセス技術チーム 研修生
2019/04–現在: 日本学術振興会 特別研究員(DC2)
2018/04–現在: 東北大学 大学院情報科学研究科 博士後期課程
2018/04–現在: 東北大学 学際高等研究教育院 博士研究教育院生
2016/04–2018/03: 東北大学 大学院情報科学研究科 博士前期課程(修了)
2016/04–2018/03: 公益財団法人 尚志社 奨学生
2010/04–2016/03: 東北大学 工学部情報知能システム総合学科(卒業)
2007-04–2010/03: 宮城県仙台第一高等学校(通信制課程を卒業)

公開リソース

日本語 BERT 訓練済みモデル

日本語版 Wikipedia をコーパスに用いて訓練した、汎用言語モデル BERT の訓練済みモデル。MeCab (ipadic) と WordPiece で単語分割したモデルと、文字単位で単語分割したモデルの2種類を公開中。自然言語処理ライブラリの Transformers でも訓練済みモデルとして利用可能

日本語 Wikipedia エンティティベクトル

日本語版 Wikipedia をコーパスに用いて訓練した、単語とエンティティの分散表現。記事本文中の記事間リンクおよび言及をそのエンティティを表すシンボルとみなし、負例サンプリング付き Skip-gram により分散表現を学習したもの。

論文・発表

論文誌

  1. 鈴木正敏, 松田耕史, 大内啓樹, 鈴木潤, 乾健太郎. データ指向型アプローチによるクローズドブック質問応答. 自然言語処理, Vol.28, No.1, March 2021 (to appear).
  2. Masatoshi Suzuki, Koji Matsuda, Satoshi Sekine, Naoaki Okazaki, Kentaro Inui. A Joint Neural Model for Fine-Grained Named Entity Classification of Wikipedia Articles. IEICE Transactions on Information and Systems, Vol. E101.D, No.1, pp.73–81, January 2018. DOI

国際会議論文(査読あり)

  1. Masatoshi Suzuki, Koji Matsuda, Satoshi Sekine, Naoaki Okazaki, Kentaro Inui. Neural Joint Learning for Classifying Wikipedia Articles into Fine-grained Named Entity Types. In Proceedings of the 30th Pacific Asia Conference on Language, Information and Computation (PACLIC 30), October 2016. 論文PDF
  2. Masatoshi Suzuki, Koji Matsuda, Satoshi Sekine, Naoaki Okazaki, Kentaro Inui. Fine-Grained Named Entity Classification with Wikipedia Article Vectors. In 2016 IEEE/WIC/ACM International Conference on Web Intelligence (WI 2016), October 2016. DOI

国内会議論文(査読なし)

  1. 鈴木正敏, 松田耕史, 大内啓樹, 鈴木潤, 乾健太郎. オープンドメイン質問応答における解答可能性判別の役割. 言語処理学会 第27回年次大会 (NLP 2021), March 2021 (to appear).
  2. 鈴木正敏, 鈴木潤, 松田耕史, 西田京介, 井之上直也. JAQKET: クイズを題材にした日本語QAデータセットの構築. 言語処理学会 第26回年次大会 (NLP 2020), pp.237–240, March 2020. 論文PDF
  3. 鈴木正敏, 松田耕史, 大内啓樹, 鈴木潤, 乾健太郎. クイズ解答タスクにおける大規模ラベルなしコーパスの利用: 言語モデルとデータ拡張. 情報処理学会 第241回自然言語処理研究会 (IPSJ-SIGNL), August 2019. 優秀研究賞
  4. 鈴木正敏, 松田耕史, 大内啓樹, 鈴木潤, 乾健太郎. クイズ解答タスクにおける大規模ラベルなしコーパスの利用: 言語モデルとデータ拡張. 第14回NLP若手の会 シンポジウム (YANS 2019), August 2019. ポスターPDF
  5. 松田耕史, 鈴木正敏, 乾健太郎. Wikidata からの遠距離教師あり学習に基づく大規模関係知識獲得. 言語処理学会 第25回年次大会 (NLP 2019), pp.659–662, March 2019. 論文PDF
  6. 佐藤拓海, 大内啓樹, 松田耕史, 鈴木正敏, 鈴木潤, 乾健太郎. 強化学習によるプログラム⽣成のためのプログラム系列分析. 言語処理学会 第25回年次大会 (NLP 2019), pp.1010–1013, March 2019. ポスターPDF
  7. 阿部香央莉, 佐藤志貴, 佐藤拓海, 藤井諒, 松田耕史, 鈴木正敏, 山口健史, 赤間怜奈, 大内啓樹, 鈴木潤, 乾健太郎. Zunkobot: 複数の知識モジュールを統合した雑談対話システム. 人工知能学会 言語・音声理解と対話処理研究会 (SLUD) 第84回研究会(第9回対話システムシンポジウム), Vol.B5, No.02, pp.112–117, November 2018.
  8. 鈴木正敏, 松田耕史, 岡崎直観, 乾健太郎. 読解による解答可能性を付与した質問応答データセットの構築. 言語処理学会 第24回年次大会 (NLP 2018), pp.702–705, March 2018. 論文PDF 若手奨励賞
  9. 関根聡, 安藤まや, 小林暁雄, 松田耕史, 鈴木正敏, Duc Nguyen, 乾健太郎. 「拡張固有表表現+Wikipedia」データ(2015年11月版Wikipedia分類作業完成版). 言語処理学会 第24回年次大会 (NLP 2018), pp.504–507, March 2018. 論文PDF
  10. 鈴木正敏, 松田耕史, 岡崎直観, 乾健太郎. Wikipedia を知識源に用いた文書検索と読解によるクイズ解答システム. 第12回NLP若手の会 シンポジウム (YANS 2017), September 2017.
  11. 伊藤拓海, 鈴木正敏, 田然, 山口健史, 岡崎直観, 乾健太郎. 自治体 QA サービスのための FAQ の自治体間の横断的解析. 第12回NLP若手の会 シンポジウム (YANS 2017), September 2017.
  12. 関根聡, 安藤まや, 松田耕史, 鈴木正敏, 乾健太郎. 「拡張固有表表現+Wikipedia」データ. 言語処理学会 第22回年次大会 (NLP 2016), pp.41–44, March 2016. 論文PDF
  13. 鈴木正敏, 松田耕史, 関根聡, 岡崎直観, 乾健太郎. Wikipedia 記事に対する拡張固有表現ラベルの多重付与. 言語処理学会 第22回年次大会 (NLP 2016), pp.797–800, March 2016. 論文PDF
  14. 鈴木正敏, 松田耕史, 関根聡, 岡崎直観, 乾健太郎. Wikipedia エントリの拡張固有表現階層への自動分類. 第10回NLP若手の会 シンポジウム (YANS 2015), September 2015.

そのほか

  1. Sewon Min, Jordan Boyd-Graber, Chris Alberti, Danqi Chen, Eunsol Choi, Michael Collins, Kelvin Guu, Hannaneh Hajishirzi, Kenton Lee, Jennimaria Palomaki, Colin Raffel, Adam Roberts, Tom Kwiatkowski, Patrick Lewis, Yuxiang Wu, Heinrich Küttler, Linqing Liu, Pasquale Minervini, Pontus Stenetorp, Sebastian Riedel, Sohee Yang, Minjoon Seo, Gautier Izacard, Fabio Petroni, Lucas Hosseini, Nicola De Cao, Edouard Grave, Ikuya Yamada, Sonse Shimaoka, Masatoshi Suzuki, Shumpei Miyawaki, Shun Sato, Ryo Takahashi, Jun Suzuki, Martin Fajcik, Martin Docekal, Karel Ondrej, Pavel Smrz, Hao Cheng, Yelong Shen, Xiaodong Liu, Pengcheng He, Weizhu Chen, Jianfeng Gao, Barlas Oguz, Xilun Chen, Vladimir Karpukhin, Stan Peshterliev, Dmytro Okhonko, Michael Schlichtkrull, Sonal Gupta, Yashar Mehdad, Wen-tau Yih. NeurIPS 2020 EfficientQA Competition: Systems, Analyses and Lessons Learned. CoRR, arXiv:2101.00133, December 2020. arXiv

学位論文

修士論文

情報検索と文章読解を組み合わせた質問応答システム 論文PDF

卒業論文

Wikipedia 記事への拡張固有表現ラベルの多重付与 論文PDF

受賞

  1. 情報処理学会第241回自然言語処理研究会 優秀研究賞(2019年8月31日)
    • クイズ解答タスクにおける大規模ラベルなしコーパスの利用: 言語モデルとデータ拡張
  2. 第1回対話システムライブコンペティション 優秀賞(2018年11月21日)
    • Zunkobot: 複数の知識モジュールを統合した雑談対話システム
  3. 言語処理学会第24回年次大会 若手奨励賞(2018年3月12日)
    • 読解による解答可能性を付与した質問応答データセットの構築
  4. 情報処理学会東北支部学生奨励賞(2016年3月12日)

資格

クイズ番組出場歴