Данные Jin10 от 26 августа: сегодня рано утром Исследовательский институт Microsoft опубликовал открытый исходный код инновационной аудиомодели VibeVoice-1.5B. VibeVoice-1.5B достигла нескольких значительных технических прорывов в области синтеза речи: она может последовательно синтезировать 90 минут сверхдостоверной речи за один раз, в то время как большинство предыдущих моделей могли синтезировать речь длиной менее 60 минут, и после 30 минут наблюдаются проблемы с дрейфом тембра и разрывами в семантике.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Открытый исходный код инновационной аудиомодели Microsoft VibeVoice-1.5B
Данные Jin10 от 26 августа: сегодня рано утром Исследовательский институт Microsoft опубликовал открытый исходный код инновационной аудиомодели VibeVoice-1.5B. VibeVoice-1.5B достигла нескольких значительных технических прорывов в области синтеза речи: она может последовательно синтезировать 90 минут сверхдостоверной речи за один раз, в то время как большинство предыдущих моделей могли синтезировать речь длиной менее 60 минут, и после 30 минут наблюдаются проблемы с дрейфом тембра и разрывами в семантике.