国際学会
- Kentaro Seki, Shinnosuke Takamichi, Norihiro Takamune, Yuki Saito, Kanami Imamura, and Hiroshi Saruwatari, “Spatial Voice Conversion: Voice Conversion Preserving Spatial Information and Non-target Signals” in Proc. Interspeech, 2024.
- Takuto Igarashi, Yuki Saito, Kentaro Seki, Shinnosuke Takamichi, Ryuichi Yamamoto, and Kentaro Tachibana and Hiroshi Saruwatari, “Noise-Robust Voice Conversion by Conditional Denoising Training Using Latent Variables of Recording Quality and Environment” in Proc. Interspeech, 2024.
- Yuki Saito, Takuto Igarashi, Kentaro Seki, Shinnosuke Takamichi, Ryuichi Yamamoto, Kentaro Tachibana, and Hiroshi Saruwatari. “SRC4VC: Smartphone-Recorded Corpus for Voice Conversion Benchmark” in Proc. Interspeech, 2024.
- Osamu Take, Shinnosuke Takamichi, Kentaro Seki, Yoshiaki Bando, and Hiroshi Saruwatari, “SaSLaW: Dialogue Speech Corpus with Audio-visual Egocentric Information Toward Environment-adaptive Dialogue Speech Synthesis” in Proc. Interspeech, 2024.
- Kentaro Seki, Shinnosuke Takamichi, Takaaki Saeki and Hiroshi Saruwatari, “Diversity-based core-set selection for text-to-speech with linguistic and acoustic features” in Proc. ICASSP, 2024.[arXiv preprint]
- Joonyong Park, Shinnosuke Takamichi, Tomohiko Nakamura, Kentaro Seki, Detai Xin and Hiroshi Saruwatari, “How Generative Spoken Language Modeling Encodes Noisy Speech: Investigation from Phonetics to Syntactics” in Proc. Interspeech, 2023. [arXiv preprint]
- Kentaro Seki, Shinnosuke Takamichi, Takaaki Saeki and Hiroshi Saruwatari, “Text-to-speech synthesis from dark data with evaluation-in-the-loop data selection” in Proc. ICASSP, 2023.[arXiv preprint]
国内学会
- 関健太郎, 高道慎之介, 佐伯高明, 猿渡洋, “データ重要度評価に基づく能動学習を用いた音声合成”, 第27回情報論的学習理論ワークショップ, 2024年11月.
- 武 伯寒, 高道 慎之介, 関健太郎, 坂東 宜昭, 猿渡 洋, “音環境に適応するテキスト音声合成のための一人称視点コーパス構築”, 情報処理学会 第151回 音声言語情報処理研究発表会, 2024年3月.
- 五十嵐 琢斗, 齋藤 佑樹, 関健太郎, 高道慎之介, 山本 龍一, 橘 健太郎, 猿渡 洋, “音声品質と音響環境の潜在変数で条件付けた Denoising Trainingによるノイズロバスト音声変換”, 電子情報通信学会研究報告, 2024年3月.
- 齋藤 佑樹, 五十嵐 琢斗, 関健太郎, 高道慎之介, 山本 龍一, 橘 健太郎, 猿渡 洋, “SRC4VCデータセット:多話者音声変換モデルのベンチマークを目的とした実デバイス収録音声コーパス”, 電子情報通信学会研究報告, 2024年3月.
- 岡本 美柚, 関 健太郎, 高道 慎之介, 齋藤 佑樹, 伊藤 貴之, “ImTTS:印象推定の可視化を用いた多話者音声合成システム”, 情報処理学会 第201回 ヒューマンコンピュータインタラクション研究会, 2024年1月.
- 岡本 美柚, 関健太郎, 高道 慎之介, 齋藤 佑樹, 伊藤 貴之, “ImTTS:印象推定の可視化を用いた多話者音声合成システム”, NICOGRAPH 2023, 2023年12月(査読あり).
- 関健太郎, 高道慎之介, 佐伯高明, 猿渡洋, “テキスト音声合成におけるデータサブセット選択のための指標検討”, 日本音響学会第150回(2023年秋季)研究発表会.
- 朴浚溶, 高道慎之介, 中村 友彦, 関健太郎, 辛德泰, 猿渡洋, “Generative Spoken Language Model を用いた劣化雑音音声の分析と他言語への適用”, 日本音響学会第149回(2023年春季)研究発表会.
- 関健太郎, 高道慎之介, 佐伯高明, 猿渡洋, “学習・評価ループを用いたデータ選択によるダークデータからの音声合成”, 日本音響学会第149回(2023年春季)研究発表会.[論文][スライド]
招待講演
- Kentaro Seki, “Data Selection for Text-to-speech with Feedback from Automatic Evaluation of Naturalness on Synthetic Speech”, in Joint Workshop of VoicePersonae and ASVspoof (VoiceMOS mini workshop) 2023, Nov. 2023.
プレプリント
- Wataru Nakata, Kentaro Seki, Hitomi Yanaka, Yuki Saito, Shinnosuke Takamichi, Hiroshi Saruwatari, “J-CHAT: Japanese Large-scale Spoken Dialogue Corpus for Spoken Dialogue Language Modeling”, 2024. [arXiv preprint]
予算
- 関 健太郎, “インターネットデータの活用によるテキスト音声合成の感情表現力向上”,2024 年度 特別研究員 DC1, 日本学術振興会.
- 中田 亘, 関 健太郎, “音声対話システムにおける表現力豊かな音声合成のためのデータセット整備と大規模言語モデルの言語知識の活用”, 300 万円, 2023 年度ディープテック人材育成事業「覚醒」, 産業技術総合研究所.
受賞
2024.03 | Google Travel Grants for Students in East Asia 受賞 |
2023.09 | 日本音響学会学生優秀発表賞受賞 |
2023.03 | IEEE SPS Travel Grant for IEEE ICASSP 2023 受賞 |