International Conference Proceedings

  1. Kentaro Seki, Shinnosuke Takamichi, Norihiro Takamune, Yuki Saito, Kanami Imamura, and Hiroshi Saruwatari, “Spatial Voice Conversion: Voice Conversion Preserving Spatial Information and Non-target Signals” in Proc. Interspeech, 2024.
  2. Takuto Igarashi, Yuki Saito, Kentaro Seki, Shinnosuke Takamichi, Ryuichi Yamamoto, and Kentaro Tachibana and Hiroshi Saruwatari, “Noise-Robust Voice Conversion by Conditional Denoising Training Using Latent Variables of Recording Quality and Environment” in Proc. Interspeech, 2024.
  3. Yuki Saito, Takuto Igarashi, Kentaro Seki, Shinnosuke Takamichi, Ryuichi Yamamoto, Kentaro Tachibana, and Hiroshi Saruwatari. “SRC4VC: Smartphone-Recorded Corpus for Voice Conversion Benchmark” in Proc. Interspeech, 2024.
  4. Osamu Take, Shinnosuke Takamichi, Kentaro Seki, Yoshiaki Bando, and Hiroshi Saruwatari, “SaSLaW: Dialogue Speech Corpus with Audio-visual Egocentric Information Toward Environment-adaptive Dialogue Speech Synthesis” in Proc. Interspeech, 2024.
  5. Kentaro Seki, Shinnosuke Takamichi, Takaaki Saeki and Hiroshi Saruwatari, “Diversity-based core-set selection for text-to-speech with linguistic and acoustic features” in Proc. ICASSP, 2024.[arXiv preprint]
  6. Joonyong Park, Shinnosuke Takamichi, Tomohiko Nakamura, Kentaro Seki, Detai Xin and Hiroshi Saruwatari, “How Generative Spoken Language Modeling Encodes Noisy Speech: Investigation from Phonetics to Syntactics” in Proc. Interspeech, 2023. [arXiv preprint]
  7. Kentaro Seki, Shinnosuke Takamichi, Takaaki Saeki and Hiroshi Saruwatari, “Text-to-speech synthesis from dark data with evaluation-in-the-loop data selection” in Proc. ICASSP, 2023.[arXiv preprint]

Preprint

  1. Wataru Nakata, Kentaro Seki, Hitomi Yanaka, Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari, “J-CHAT: Japanese Large-scale Spoken Dialogue Corpus for Spoken Dialogue Language Modeling”, 2024. [arXiv preprint]

Domestic Conference Proceedings

  1. 関健太郎, 高道慎之介, 佐伯高明, 猿渡洋, “データ重要度評価に基づく能動学習を用いた音声合成”, 第27回情報論的学習理論ワークショップ, 2024年11月.
  2. 武 伯寒, 高道 慎之介, 関健太郎, 坂東 宜昭, 猿渡 洋, “音環境に適応するテキスト音声合成のための一人称視点コーパス構築”, 情報処理学会 第151回 音声言語情報処理研究発表会, 2024年3月.
  3. 五十嵐 琢斗, 齋藤 佑樹, 関健太郎, 高道慎之介, 山本 龍一, 橘 健太郎, 猿渡 洋, “音声品質と音響環境の潜在変数で条件付けた Denoising Trainingによるノイズロバスト音声変換”, 電子情報通信学会研究報告, 2024年3月.
  4. 齋藤 佑樹, 五十嵐 琢斗, 関健太郎, 高道慎之介, 山本 龍一, 橘 健太郎, 猿渡 洋, “SRC4VCデータセット:多話者音声変換モデルのベンチマークを目的とした実デバイス収録音声コーパス”, 電子情報通信学会研究報告, 2024年3月.
  5. 岡本 美柚, 関 健太郎, 高道 慎之介, 齋藤 佑樹, 伊藤 貴之, “ImTTS:印象推定の可視化を用いた多話者音声合成システム”, 情報処理学会 第201回 ヒューマンコンピュータインタラクション研究会, 2024年1月.
  6. 岡本 美柚, 関健太郎, 高道 慎之介, 齋藤 佑樹, 伊藤 貴之, “ImTTS:印象推定の可視化を用いた多話者音声合成システム”, NICOGRAPH 2023, 2023年12月(査読あり).
  7. 関健太郎, 高道慎之介, 佐伯高明, 猿渡洋, “テキスト音声合成におけるデータサブセット選択のための指標検討”, 日本音響学会第150回(2023年秋季)研究発表会.
  8. 朴浚溶, 高道慎之介, 中村 友彦, 関健太郎, 辛德泰, 猿渡洋, “Generative Spoken Language Model を用いた劣化雑音音声の分析と他言語への適用”, 日本音響学会第149回(2023年春季)研究発表会.
  9. 関健太郎, 高道慎之介, 佐伯高明, 猿渡洋, “学習・評価ループを用いたデータ選択によるダークデータからの音声合成”, 日本音響学会第149回(2023年春季)研究発表会.[Paper][Slide]

Invited talk

  1. Kentaro Seki, “Data Selection for Text-to-speech with Feedback from Automatic Evaluation of Naturalness on Synthetic Speech”, in Joint Workshop of VoicePersonae and ASVspoof (VoiceMOS mini workshop) 2023, Nov. 2023.

Award

2024.03 Google Travel Grants for Students in East Asia
2023.09 日本音響学会学生優秀発表賞受賞
2023.03 IEEE SPS Travel Grant for IEEE ICASSP 2023