โ MFCC๋?
- MFCC
- ์ค๋์ค ์ ํธ์์ ์ถ์ถํ ์ ์๋ ์๋ฆฌ์ ๊ณ ์ ํ ํน์ง์ ๋ํ๋ด๋ ์์น
- ๊ธฐ์ ์ ์ผ๋ก๋ Mel Spectrum์์ Cepstral ๋ถ์์ ํตํด ์ถ์ถ๋ ๊ฐ์ ์๋ฏธ
- MFCC ์ฌ์ฉ ์
- ํ์ ๊ฒ์ฆ(Speaker Verification)
- ํ์ ์ธ์(Speaker Recognition)์ ์ธ๋ถ ๋ถ๋ฅ
- ํ์๊ฐ ํน์ ๊ทธ ์ฌ๋์ด ๋ง๋์ง๋ฅผ ํ์ธํ๋ ๊ธฐ์
- ์์คํ ์ ๋ฑ๋ก๋ ํน์ ํ ์์ฑ์ผ๋ก ์ ์ฌ๋๋ฅผ ๊ณ์ฐํ์ฌ ํ์๋ฅผ ํ์ธ
- ์์
์ฅ๋ฅด ๋ถ๋ฅ(Music Genre Classification)
- ์์ ์ ํน์ ๊ตฌ๊ฐ์์ ์ฌ๋ฌ feature๋ฅผ ์ถ์ถํ์ฌ ์ฅ๋ฅด๋ฅผ ๋ถ๋ฅ
- ํ์ ๊ฒ์ฆ(Speaker Verification)
โ๏ธMFCC์ ์ถ์ถ ๊ณผ์

- ์ค๋์ค ์ ํธ๋ฅผ ํ๋ ์๋ณ(๋ณดํต 20-40ms)๋ก ๋๋๋ค
- ๋๋ ๊ฐ ํ๋ ์์ ๋ํด FFT๋ฅผ ์ ์ฉํด Spectrum์ ๊ตฌํ๋ค
- Spectrum์ Mel Filter Bank๋ฅผ ์ ์ฉํด Mel Spectrum์ ๊ตฌํ๋ค
- Mel Spectrum์ Cepstral Analysis์ ์ ์ฉํด MFCC๋ฅผ ๊ตฌํ๋ค
โ FFT(Fast Fourier Transform)
- FFT
- ์ ํธ๋ฅผ ์๊ฐ ์ฐจ์์์ ์ฃผํ์ ์ฑ๋ถ์ผ๋ก ๋ณํํ๋ ์๊ณ ๋ฆฌ์ฆ
- ๊ธฐ์กด์ ์ด์ฐ ํธ๋ฆฌ์ ๋ณํ(DFT)์ ๋น ๋ฅด๊ฒ ์ํํ๋ ๋ฐ ์ต์ ํ๋ ์๊ณ ๋ฆฌ์ฆ
- ๋จ์
- ์๊ฐ๋๋ฉ์ธ์ ์ ๋ณด๋ฅผ ์์ ํ ์์ด๋ฒ๋ฆผ
- ์ฆ, ์๊ฐ์ ํ๋ฆ์ ๋ฐ๋ฅธ ์ฃผํ์ ๋ณํ์ ์๊ธฐ ์ด๋ ค์
โ Spectrum
- Spectrum
- ์ฃผํ์(๊ฐ๋ก์ถ)์ ๋ฐ๋ฅธ ์์(์ธ๋ก์ถ)์ ํํ
- ๊ฐ ์ฃผํ์ ๋์ญ๋ณ ์ธ๊ธฐ๋ฅผ ์ ์ ์์
- ๋ฐฐ์ ๊ตฌ์กฐ
- ์๋ฆฌ๋ ๊ธฐ๋ณธ ์ฃผํ์(fundamental frequency)์ ํจ๊ป ๊ธฐ๋ณธ ์ฃผํ์์ ์ ์๋ฐฐ์ธ ๋ฐฐ์(harmonics)๋ค๋ก ๊ตฌ์ฑ๋จ
- ๋ฐฐ์ ๊ตฌ์กฐ๋ ์ ๊ธฐ๋ ์ฑ๋์ ๊ตฌ์กฐ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ฉฐ, ๋ฐฐ์ ๊ตฌ์กฐ์ ์ฐจ์ด๊ฐ ์์์ ์ฐจ์ด๋ฅผ ๋ง๋ฆ
๋ฐ๋ผ์, Spectrum์์ ๋ฐฐ์ ๊ตฌ์กฐ๋ฅผ ์ ์ถํด๋ผ ์ ์๋ค๋ฉด ์๋ฆฌ์ ๊ณ ์ ํ ํน์ง์ ์ฐพ์๋ผ ์ ์์
โ Cepstral Analysis
- ํฌ๋จผํธ(Formants)
- ํผํฌ(peak), ์๋ฆฌ๊ฐ ๊ณต๋ช ๋๋ ํน์ ์ฃผํ์ ๋์ญ์ ๋ปํจ
- ์๋ฆฌ๋ ์ฑ๋๋ฅผ ์ง๋๋ฉด์ ํฌ๋จผํธ๋ฅผ ๋ง๋ ์ฆํญ๋๊ฑฐ๋ ๊ฐ์ ๋จ
- ํฌ๋จผํธ๋ ๋ฐฐ์๊ณผ ๋ง๋ ์๋ฆฌ์ ํํฐ ์ญํ ์ ํจ
- ๋ฐ๋ผ์, ํฌ๋จผํธ๋ ์๋ฆฌ์ ํน์ง์ ์ ์ถํ ์ ์๋ ์ค์ํ ๋จ์์
- Spectral Envelope
- ํฌ๋จผํธ๋ค์ ์ฐ๊ฒฐํ ๊ณก์
- Cepstral Analysis
- Spectral Envelope์์ Spectrum์ ๋ถ๋ฆฌํ๋ ์์
- log์ IFFT(Inverse FFT - ์ญ ๊ณ ์ ํธ๋ฆฌ์ ๋ณํ) ์๊ณ ๋ฆฌ์ฆ์ด ์ฌ์ฉ๋จ
โ Mel Spectrum
- Mel Scale
- ์ฌ๋์ ์ฒญ๊ฐ๊ธฐ๊ด์ ๊ณ ์ฃผํ์(high frequency) ๋ณด๋ค ์ ์ฃผํ์(low frequency) ๋์ญ์์ ๋ ๋ฏผ๊ฐ
- ์ฌ๋์ ์ด๋ฐ ํน์ฑ์ ๋ฐ์ํด ๋ฌผ๋ฆฌ์ ์ธ ์ฃผํ์์ ์ค์ ์ฌ๋์ด ์ธ์ํ๋ ์ฃผํ์์ ๊ด๊ณ๋ฅผ ํํํ ๊ฒ
- Filter Bank๋ฅผ ๋๋ ๋ ์ด๋ค ๊ฐ๊ฒฉ์ผ๋ก ๋๋ ์ผ ํ๋์ง ์๋ ค์ฃผ๋ ์ญํ
- Mel Spectrum
- Mel Scale์ ๊ธฐ๋ฐํ Filter Bank๋ฅผ Spectrum์ ์ ์ฉํ์ฌ ๋์ถํ ๊ฒ
โ STFT(Short-Time Fourier Transform)
- STFT
- time window๋ฅผ ์์ง์ด๋ฉฐ FFT๋ฅผ ์ํ์ํค๋ ๊ฒ
- ๋จ์
- ์ด๊ธฐ ์ ํธ๋ฅผ Window length์ ๋ฐ๋ผ ๋ถ๋ฆฌ์ํค๊ธฐ ๋๋ฌธ์ ํธ๋ฆฌ์ ๋ณํ์ ์ฌ์ฉ๋๋ ์ ํธ์ ๊ธธ์ด๋ฅผ ๊ฐ์์ํค๊ณ , ๋ฐ๋ผ์ ์ฃผํ์ Resolution์ด ์ ํ๋จ
- Window length๋ฅผ ์ฆ๊ฐ์์ผ ์ฃผํ์ Resolution์ ํฅ์์์ผ๋, ์๊ฐ์ ๋ํ Recolution์ ๋ฐ๋๋ก ์ ํ๋จ
์ฐธ๊ณ