Publications
Publications
ここでは、自分の携わった研究についての説明をしようと思います。 理系のほかの分野を専攻して大学を卒業した方で、最近機械学習に興味が出てきて勉強をしてみたという方が概要をつかめることを目標としています。
Efficiency(効率化)
Segment-Level Vectorized Beam Search Based on Partially Autoregressive Inference: 自回帰と非自回帰の推論を組み合わせた新しいデコーディング手法を提案。精度と推論速度のトレードオフを改善しました。
On-device Streaming Discrete Speech Units
Context-Driven Dynamic Pruning for Large Speech Foundation Models
Systems(システム)
ESPnet-ONNX: Bridging a Gap Between Research and Production: ESPnetの学習済みモデルをONNX形式に変換するためのツール。
ESPnet-EZ: Python-Only ESPnet For Easy Fine-Tuning And Integration: ESPnetをPythonのみで扱えるようにした軽量ラッパー。簡単なファインチューニングや外部ライブラリとの統合が可能。
Co-authord(共著)
A Comparative Study on Transformer vs RNN in Speech Applications: 音声認識タスクにおけるRNNとTransformerの比較検討。
Towards Inclusive ASR: Investigating Voice Conversion for Dysarthric Speech Recognition in Low-Resource Languages