Jin10 дані 26 серпня, сьогодні вночі дослідницький інститут Microsoft відкрив вихідний код інноваційної аудіомоделі VibeVoice-1.5B. VibeVoice-1.5B здійснив кілька значних технологічних проривів у сфері голосу: він може одноразово безперервно синтезувати 90 хвилин надреалістичного голосу, тоді як більшість моделей раніше могли синтезувати голос лише до 60 хвилин, і після 30 хвилин виникали проблеми з відхиленням тону, розривами в семантиці та ін.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Відкритий вихідний код аудіомодель VibeVoice-1.5B від Microsoft
Jin10 дані 26 серпня, сьогодні вночі дослідницький інститут Microsoft відкрив вихідний код інноваційної аудіомоделі VibeVoice-1.5B. VibeVoice-1.5B здійснив кілька значних технологічних проривів у сфері голосу: він може одноразово безперервно синтезувати 90 хвилин надреалістичного голосу, тоді як більшість моделей раніше могли синтезувати голос лише до 60 хвилин, і після 30 хвилин виникали проблеми з відхиленням тону, розривами в семантиці та ін.