Перейти до вмісту

MFCC

Матеріал з Вікіпедії — вільної енциклопедії.

Мелчастотні кепстральні коефіцієнти (англ. Mel-frequency cepstral coefficients (MFCCs)) — це коефіцієнти мел-частотного кепстру[en][1].

Мел-шкала є емпіричною шкалою, що ґрунтується на людському відчутті частоти звуку[2]. На основі MFCC розраховуються ознаки кольоровості для нейронних мереж при розпізнаванні конкретної голосової команди[2].

Примітки

[ред. | ред. код]
  1. Min Xu та ін. (2004). HMM-based audio keyword generation (PDF). У Kiyoharu Aizawa; Yuichi Nakamura; Shin'ichi Satoh (ред.). Advances in Multimedia Information Processing – PCM 2004: 5th Pacific Rim Conference on Multimedia. Springer. ISBN 978-3-540-23985-7. Архів оригіналу (PDF) за 10 травня 2007.
  2. а б Пилипенко, В. О.; Слюсарь, І. І.; Слюсар, В. І. (21-22 жовтня 2021 р.). Варіант використання нейронної мережі в системі «Smart Home» (PDF) (укр.) (вид. Інтеграція інформаційних систем і інтелектуальних технологій в умовах трансформації інформаційного суспільства: тези доповідей IV Міжнародної науково-практичної конференції, що присвячена 50-ій річниці кафедри інформаційних систем та технологій.). Полтава: Олді+. с. 93—96. doi:10.32782/978-966-289-562-9. ISBN 978-966-289-562-9.