Skip to content

Commit cdebd53

Browse files
committed
Started grundlagen.
1 parent 8ece8ec commit cdebd53

File tree

4 files changed

+108
-3
lines changed

4 files changed

+108
-3
lines changed

chapter/Grundlagen.tex

Lines changed: 34 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -1,10 +1,41 @@
11
\section{Grundlagen}\label{sec:Grundlagen}
2-
\subsection{Framing}
3-
\subsection{Windowing (Zeitfenster)}
2+
\subsection{Signalvorverarbeitung}
3+
Um ein gegebenes Audiosignal einheitlich verarbeiten zu können, muss dieses zunächst mittels verschiedener Verfahren vorbereitet werden.
4+
Ziel dieser Vorverarbeitung ist es, die Effizienz und Effektivität des anschließenden Verarbeitungsprozess zu erhöhen und somit ein verbessertes Ergebnis zu erzielen \autocite[vgl.][S. 11672]{lokesh_speech_2019}.
5+
Die Vorverarbeitung im Rahmen dieser Arbeit beschränkt sich auf die beiden Schritte Framing und Windowing, welche in den folgenden Unterkapiteln genauer erläutert werden.
6+
7+
\subsubsection{Framing}
8+
Das Unterteilen von Audiosignalen in kleinere Blöcke (Frames) wird als Framing bezeichnet.
9+
Dabei muss zunächst eine einheitliche Blockgröße festgelegt werden.
10+
Außerdem wird eine Überlagerungszeit definiert, welche eine Überlappung der einzelnen Blöcke verursacht.
11+
% TODO: Quelle hinzufügen
12+
% TODO: Warum wird überlagert -> Quelle
13+
14+
\subsubsection{Windowing (Zeitfenster)}
15+
\begin{figure}
16+
\centering
17+
\includegraphics[width=0.8\textwidth, keepaspectratio]{images/hann_window.png}
18+
\caption{Von Hann Fensterfunktion \autocite{noauthor_numpyhanning_nodate}}
19+
\label{fig:vonHannFenster}
20+
\end{figure}
21+
Um die bei der Unterteilung des Audiosignals entstandenen Diskontinuitäten aufzulösen, wird eine Fensterfunktion auf die einzelnen Blöcke angewendet.
22+
Abbildung~\ref{fig:vonHannFenster} zeigt die von Hann Fensterfunktion, welche neben dem Hamming Fenster zu den typischen Fensterfunktionen in der Audiosignalverarbeitung zählt.
23+
Durch den Nulldurchgang am Anfang und Ende der Fensterfunktion werden die Amplituden des Blocksignals nach Anwenden der Funktion an den Grenzen auf Null gezogen, wodurch sich ein kontinuierlicher, periodischer Signalverlauf ergibt.
24+
Dieser wird von den in dieser Arbeit verwendeten Funktionen wie etwa der \ac{FFT} vorausgesetzt.
25+
26+
Wird der Schritt des Windowing nicht durchgeführt, führt dies zu einem Phänomen namens Spectral leakage.
27+
Der Amplitudensprung an den Blockenden resultiert in der Registrierung einer vielzahl von Frequenzen, welches die korrekte Ermittlung der sich im Signal befindenden Frequenzen erschwert.
28+
Wie der Name bereits beschreibt, wird aus einer eindeutigen Frequenz, ein Spektrum aus Frequenzen.
29+
% TODO: Wird Windowing in diesem Anwendungsfall überhaupt benötigt?
30+
431
\begin{itemize}
532
\item Spektral leakage
633
\item Hamming und Han Fenster
734
\item Unterschied zu Framing
835
\end{itemize}
936
\subsection{Auto regressive moving average filter}
10-
\subsection{Cepstral vectors}
37+
% TODO: Was ist es + was hat es mit LPC zu tun
38+
39+
\subsection{Cepstral vectors/coefficients}
40+
% TODO: Was sind Cepstral coefficients
41+
% TODO: Warum werden sie verwendet, was ist der Vorteil?

images/hann_window.png

15.3 KB
Loading

literatur/literatur.bib

Lines changed: 71 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,71 @@
1+
2+
@book{institute_of_electrical_and_electronics_engineers_2014_2014,
3+
address = {Piscataway, NJ},
4+
title = {2014 {IEEE} {International} {Conference} on {Signal} {Processing}, {Communications} and {Computing} ({ICSPCC} 2014): {Guilin}, {China}, 5 - 8 {August} 2014},
5+
isbn = {978-1-4799-5274-8 978-1-4799-5275-5},
6+
shorttitle = {2014 {IEEE} {International} {Conference} on {Signal} {Processing}, {Communications} and {Computing} ({ICSPCC} 2014)},
7+
language = {eng},
8+
publisher = {IEEE},
9+
editor = {Institute of Electrical {and} Electronics Engineers},
10+
year = {2014},
11+
keywords = {LPC, LPCC, MFCC, Pre-Processing},
12+
annote = {Literaturangaben},
13+
file = {Speaker_recognition_based_on_principal_component_analysis_of_LPCC_and_MFCC.pdf:/home/henry/Zotero/storage/4ZJ4KIT4/Speaker_recognition_based_on_principal_component_analysis_of_LPCC_and_MFCC.pdf:application/pdf;Table of Contents PDF:/home/henry/Zotero/storage/FKZKW2TM/Institute of Electrical and Electronics Engineers - 2014 - 2014 IEEE International Conference on Signal Proce.pdf:application/pdf},
14+
}
15+
16+
@incollection{satapathy_svm_2015,
17+
address = {Cham},
18+
title = {{SVM} and {HMM} {Modeling} {Techniques} for {Speech} {Recognition} {Using} {LPCC} and {MFCC} {Features}},
19+
volume = {327},
20+
isbn = {978-3-319-11932-8 978-3-319-11933-5},
21+
url = {http://link.springer.com/10.1007/978-3-319-11933-5_58},
22+
urldate = {2023-01-18},
23+
booktitle = {Proceedings of the 3rd {International} {Conference} on {Frontiers} of {Intelligent} {Computing}: {Theory} and {Applications} ({FICTA}) 2014},
24+
publisher = {Springer International Publishing},
25+
author = {Ananthi, S. and Dhanalakshmi, P.},
26+
editor = {Satapathy, Suresh Chandra and Biswal, Bhabendra Narayan and Udgata, Siba K. and Mandal, J.K.},
27+
year = {2015},
28+
doi = {10.1007/978-3-319-11933-5_58},
29+
note = {Series Title: Advances in Intelligent Systems and Computing},
30+
pages = {519--526},
31+
}
32+
33+
@article{bimbot_tutorial_2004,
34+
title = {A {Tutorial} on {Text}-{Independent} {Speaker} {Verification}},
35+
volume = {2004},
36+
issn = {1687-6180},
37+
url = {https://asp-eurasipjournals.springeropen.com/articles/10.1155/S1110865704310024},
38+
doi = {10.1155/S1110865704310024},
39+
language = {en},
40+
number = {4},
41+
urldate = {2023-01-17},
42+
journal = {EURASIP Journal on Advances in Signal Processing},
43+
author = {Bimbot, Frédéric and Bonastre, Jean-François and Fredouille, Corinne and Gravier, Guillaume and Magrin-Chagnolleau, Ivan and Meignier, Sylvain and Merlin, Teva and Ortega-García, Javier and Petrovska-Delacrétaz, Dijana and Reynolds, Douglas A.},
44+
month = dec,
45+
year = {2004},
46+
pages = {22},
47+
}
48+
49+
@article{lokesh_speech_2019,
50+
title = {Speech recognition system using enhanced mel frequency cepstral coefficient with windowing and framing method},
51+
volume = {22},
52+
issn = {1386-7857, 1573-7543},
53+
url = {http://link.springer.com/10.1007/s10586-017-1447-6},
54+
doi = {10.1007/s10586-017-1447-6},
55+
language = {en},
56+
number = {S5},
57+
urldate = {2023-02-07},
58+
journal = {Cluster Computing},
59+
author = {Lokesh, S. and Devi, M. Ramya},
60+
month = sep,
61+
year = {2019},
62+
keywords = {Framing, MFCC, Pre-Processing, Windowing},
63+
pages = {11669--11679},
64+
}
65+
66+
@misc{noauthor_numpyhanning_nodate,
67+
title = {numpy.hanning — {NumPy} v1.24 {Manual}},
68+
url = {https://numpy.org/doc/stable/reference/generated/numpy.hanning.html},
69+
urldate = {2023-02-07},
70+
file = {numpy.hanning — NumPy v1.24 Manual:/home/henry/Zotero/storage/65F33M93/numpy.hanning.html:text/html},
71+
}

pages/abkuerzungsverzeichnis.tex

Lines changed: 3 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -3,5 +3,8 @@ \section*{Abkürzungsverzeichnis}
33
\begin{acronym}
44
\acro{DHBW}[DHBW]{Duale Hochschule Ba\-den-\-Würt\-tem\-berg}
55
\acroplural{DHBW}[DHBW]{Dualen Hochschule Ba\-den-\-Würt\-tem\-berg}
6+
\acro{FFT}[FFT]{Fast Fourier Transform}
7+
\acro{LPC}[LPC]{Linear Predicitve Coding}
8+
\acro{LPCC}[LPCC]{Linear Prediction Cepstral Coefficient}
69
\end{acronym}
710
\newpage

0 commit comments

Comments
 (0)