Skip to content
Snippets Groups Projects
Commit ab54273a authored by Vincent Betker's avatar Vincent Betker
Browse files

initial commit

parents
No related branches found
No related tags found
No related merge requests found
Showing
with 998 additions and 0 deletions
## Core latex/pdflatex auxiliary files:
*.aux
*.lof
*.log
*.lot
*.fls
*.out
*.toc
*.fmt
*.fot
*.cb
*.cb2
.*.lb
## Intermediate documents:
*.dvi
*.xdv
*-converted-to.*
# these rules might exclude image files for figures etc.
# *.ps
# *.eps
# *.pdf
## Generated if empty string is given at "Please type another file name for output:"
.pdf
## Bibliography auxiliary files (bibtex/biblatex/biber):
*.bbl
*.bcf
*.blg
*-blx.aux
*-blx.bib
*.run.xml
## Build tool auxiliary files:
*.fdb_latexmk
*.synctex
*.synctex(busy)
*.synctex.gz
*.synctex.gz(busy)
*.pdfsync
## Build tool directories for auxiliary files
# latexrun
latex.out/
## Auxiliary and intermediate files from other packages:
# algorithms
*.alg
*.loa
# achemso
acs-*.bib
# amsthm
*.thm
# beamer
*.nav
*.pre
*.snm
*.vrb
# changes
*.soc
# comment
*.cut
# cprotect
*.cpt
# elsarticle (documentclass of Elsevier journals)
*.spl
# endnotes
*.ent
# fixme
*.lox
# feynmf/feynmp
*.mf
*.mp
*.t[1-9]
*.t[1-9][0-9]
*.tfm
#(r)(e)ledmac/(r)(e)ledpar
*.end
*.?end
*.[1-9]
*.[1-9][0-9]
*.[1-9][0-9][0-9]
*.[1-9]R
*.[1-9][0-9]R
*.[1-9][0-9][0-9]R
*.eledsec[1-9]
*.eledsec[1-9]R
*.eledsec[1-9][0-9]
*.eledsec[1-9][0-9]R
*.eledsec[1-9][0-9][0-9]
*.eledsec[1-9][0-9][0-9]R
# glossaries
*.acn
*.acr
*.glg
*.glo
*.gls
*.glsdefs
*.lzo
*.lzs
*.slg
*.slo
*.sls
# uncomment this for glossaries-extra (will ignore makeindex's style files!)
# *.ist
# gnuplot
*.gnuplot
*.table
# gnuplottex
*-gnuplottex-*
# gregoriotex
*.gaux
*.glog
*.gtex
# htlatex
*.4ct
*.4tc
*.idv
*.lg
*.trc
*.xref
# hyperref
*.brf
# knitr
*-concordance.tex
# TODO Uncomment the next line if you use knitr and want to ignore its generated tikz files
# *.tikz
*-tikzDictionary
# listings
*.lol
# luatexja-ruby
*.ltjruby
# makeidx
*.idx
*.ilg
*.ind
# minitoc
*.maf
*.mlf
*.mlt
*.mtc[0-9]*
*.slf[0-9]*
*.slt[0-9]*
*.stc[0-9]*
# minted
_minted*
*.pyg
# morewrites
*.mw
# newpax
*.newpax
# nomencl
*.nlg
*.nlo
*.nls
# pax
*.pax
# pdfpcnotes
*.pdfpc
# sagetex
*.sagetex.sage
*.sagetex.py
*.sagetex.scmd
# scrwfile
*.wrt
# svg
svg-inkscape/
# sympy
*.sout
*.sympy
sympy-plots-for-*.tex/
# pdfcomment
*.upa
*.upb
# pythontex
*.pytxcode
pythontex-files-*/
# tcolorbox
*.listing
# thmtools
*.loe
# TikZ & PGF
*.dpth
*.md5
*.auxlock
# titletoc
*.ptc
# todonotes
*.tdo
# vhistory
*.hst
*.ver
# easy-todo
*.lod
# xcolor
*.xcp
# xmpincl
*.xmpi
# xindy
*.xdy
# xypic precompiled matrices and outlines
*.xyc
*.xyd
# endfloat
*.ttt
*.fff
# Latexian
TSWLatexianTemp*
## Editors:
# WinEdt
*.bak
*.sav
# Texpad
.texpadtmp
# LyX
*.lyx~
# Kile
*.backup
# gummi
.*.swp
# KBibTeX
*~[0-9]*
# TeXnicCenter
*.tps
# auto folder when using emacs and auctex
./auto/*
*.el
# expex forward references with \gathertags
*-tags.tex
# standalone packages
*.sta
# Makeindex log files
*.lpz
# xwatermark package
*.xwm
## OSes:
# macOS
.DS_Store
## Other:
# draw.io
*.bkp
# REVTeX puts footnotes in the bibliography by default, unless the nofootinbib
# option is specified. Footnotes are the stored in a file with suffix Notes.bib.
# Uncomment the next line to have this generated file ignored.
#*Notes.bib
Hier sind Abbildungen beigefügt, die für das Verständnis der Arbeit nicht zwingend notwendig sind und/oder einen gewissen Umfang überschreiten.
\newpage
\section{Softwarearchitektur}
\label{softwarearchitektur}
Die Abbildung zeigt die Architektur der entwickelten Software.
\begin{figure}[ht]
\centering
\includegraphics[width=\textwidth]{graphics/sw_architektur}
\end{figure}
\ No newline at end of file
\chapter{Abbildungen}
\label{abbildungen_tabellen}
\input{abbildungen}
\chapter{Zusätzliche Dokumente}
\label{dokumente}
\input{dokumente}
\chapter{Digitaler Anhang}
\label{digitaler_datenträger}
\input{digitaler_anhang}
Die vorliegende Arbeit befindet sich als PDF-Datei im Hauptverzeichnis des digitalen Datenträgers. Der weitere Inhalt ist nach der folgenden Struktur gegliedert:
\begin{itemize}
\item \verb+01_Modellierung+: Arbeitsverzeichnis mit Ergebnissen und Programmcode des implementierten Modells
\item \verb+02_Eingangsdaten+: Für die Modellierung herangezogene Daten
\item \verb+03_Quellen+: alle digital vorliegende Quellen
\item \verb+04_Abbildungen+: alle Abbildungen dieser Arbeit als Vektorgrafik
\item \verb+05_Dokumente+: alle Anhänge \ref{dokumente} sowie ggf. weitere, aus Platzgründen nicht dieser Arbeit beigelegte Dokumente
\end{itemize}
In diesem Anhang sind zur Bearbeitung der Aufgabenstellung begleitend erstellte und herangezogene Dokumente enthalten. Folgende Dokumente sind hier zu finden:
\begin{itemize}
\item Checkliste “Letzte Erledigungen vor Abgabe der Arbeit"
\end{itemize}
\includepdf{enclosed_documents/Checkliste.pdf}
\ No newline at end of file
\chapter{Einleitung}
\label{einleitung}
\input{einleitung}
\chapter{Nutzung der Vorlage}
\label{nutzung}
\input{nutzung}
\chapter{Validierung}
\label{validierung}
\input{validierung}
\chapter{Untersuchungen und Ergebnisse}
\label{ergebnisse}
\input{ergebnisse}
\chapter{Diskussion und Ausblick}
\label{diskussion}
\input{diskussion}
\ No newline at end of file
\color{black}
In diesem Kapitel fassen Sie Ihre Arbeit zusammen, beantworten - soweit möglich - Ihre Forschungsfragen, weisen auf Grenzen und Einschränkungen Ihrer Erkenntnisse hin und geben einen Ausblick auf weitergehende Forschungsfragen, die sich aus Ihrer Arbeit ergeben.
\color{gray}
Durch die Bearbeitung der aus der Aufgabenstellung abgeleiteten Forschungsfragen konnten in Hinblick auf das Fallbeispiel einige Erkenntnisse gewonnen werden. So ist die Festlegung von Prognosehorizont und Prognoseintervall für die strategische Planung für das Unternehmen aus dem Fallbeispiel in \acs{kap} \ref{nutzung} beschrieben. In diesem Kapitel wird gleichermaßen begründet, weshalb die Absatzprognose, als ursprünglicher Gegenstand dieser Arbeit, hier durch eine Prognose der Marge zu ersetzen ist, um einen Mehrwert bezüglich der strategischen Planung zu erhalten. Weiterhin werden geeignete Prognoseverfahren in den Abschnitten \ref{sec:anpassung} und \ref{sec:struktur} vorgestellt, und die Erkennung und Bewertung signifikanter Einflussgrößen in \acs{abschn} \ref{sec:docs} diskutiert. Abschließend sollen nunmehr die Erkenntnisse bezüglich der Forschungsfragen diskutiert und ein Ausblick gegeben werden, um die Ergebnisse einzuordnen.
\subsubsection{Können \acs{ML}-Methoden in Hinblick auf das Fallbeispiel eine bessere Prognosegüte als konventionelle Prognosemethoden gewährleisten?}
Für die Prognose in der hier festgelegten Form hat sich gezeigt, dass das entwickelte multivariate \ac{ML}-Modell im Vergleich mit konventionellen Verfahren und auch dem univariaten \acs{ML}-Ansatz eine bessere Performance erzielt. Das herangezogenen Fehlermaß \acs{smape} liegt mit 31.55 \% (\acs{vgl} \acs{tab.} \ref{tab_results}) um 8 \% und 5 \% unter denen der besten konventionellen Methode, die hier auf naive Weise den letzten Beobachtungswert desselben Saisonzeitpunktes (\acs{vgl} \acs{abschn} \ref{vergleichsmodelle}) als Prognosewert ausgibt. Dabei ist zu berücksichtigen, dass dieses Ergebnis lediglich für den vorliegenden spezifischen Fall und die durchgeführte \ac{ms}-Prognose mit einem Prognoseintervall von einem Monat und einem Prognosehorizont von drei Monaten repräsentativ ist.
Als Einschränkung ist zu nennen, dass einige der für den Vergleich herangezogenen Modelle ebenfalls durch eine Hyperparameteroptimierung verbessert werden können. Diese Optimierung erfordert jedoch zusätzliche Expertise\footnote{Dass auch konventionelle statistische Prognosemethoden Potenzial für Optimierung bieten, verdeutlicht beispielsweise die \textit{M-Competition} von \textcite{Makridakis2000}.} sowie einen gewissen Aufwand in der Implementierung und wird daher im Rahmen dieser Arbeit nicht berücksichtigt. Es ist anzunehmen, dass im Zuge weiterer Untersuchungen auf diesem Wege die Performance des \acs{arima} und Holt-Winters Modells gesteigert werden könnte, wodurch der Vergleich mit dem multivariaten \ac{ML}-Modell möglicherweise anders ausfiele.
\subsubsection{Welche Einflussfaktoren lassen sich zu welchem Grad anhand einer \ac{ML}-Prognose im Fallbeispiel als relevant identifizieren?}
Die \ac{FS} (\acs{vgl} \acs{abschn} \ref{sec:docs} und \ref{sec:graphics}) aus 276 Features (\acs{vgl} \acs{abschn} \ref{sec:graphics}) hat ergeben, dass der Output des \ac{rf}-Algorithmus (\acs{vgl} \acs{abschn} \ref{sec:anpassung}) und damit der des mulitvariaten \ac{ML}-Modells zu 80 \% durch die folgenden fünf Features \acs{bzw} Eingangsgrößen bestimmt wird:
\begin{itemize}
\item dem Transportvolumen des Vormonats zu 20 \%,
\item der Anzahl der betriebsbereiten Lkw zu 17 \%,
\item dem Containerumschlag des Vormonats im Hafen Shanghai zu 14 \%,
\item dem Kurs eines \acs{etf} auf den globalen Aktienindex von \textit{MSCI} zu 13 \%,
\item der Gesamtstaulänge auf deutschen Autobahnen zu 10 \%,
\item dem Rohölpreis zu 6 \%.
\end{itemize}
Der Einfluss der Lkw-Anzahl kann als Anzeichen gesehen werden, dass die Zielgröße trotz der vorgenommenen Datenintegration (\acs{vgl} \acs{abschn} \ref{sec:ergebnisse}) weitere unternehmensinterne Abhängigkeiten aufweist. Wie in \acs{abschn} \ref{sec:graphics} herausgearbeitet, ist dies jedoch ungünstig, falls die Prognose als Entscheidungshilfe herangezogen werden soll. Diesbezüglich könnten weiterführende Untersuchungen von Vorteil sein.
Davon abgesehen sind die angeführten Einflussgrößen plausibel, da im Rahmen der Ist-Analyse in Hinblick auf potenziell relevante Prädiktoren gewonnene Erkenntnisse (\acs{vgl} \acs{abschn} \ref{sec:graphics}) sich in den Ergebnissen widerspiegeln, wie beispielsweise der Einfluss aus Shanghai als häaufigster Ursprungshafen der transportierten Container. Wären die von den Expert:innen genannten Größen irrelevant, ist anzunehmen, dass der Algorithmus mit univariaten Features aus der Zeitreihe der Zielgröße bessere Ergebnisse erzielen würde. Zum einen tauchen diese jedoch nicht in der Übersicht der relevanten Features auf und zum anderen schneidet das rein univariate \ac{ML}-Modell in Hinblick auf die Performance deutlich schlechter als das multivariate Modell ab (\acs{vgl} \acs{tab.} \ref{tab_results}).
Als Einschränkung ist zu erwähnen, dass die hier genannten Einflussfaktoren lediglich anhand von Regression \acs{bzw} dem verwendeten \ac{ML}-Modell identifiziert worden sind und daher weder von Kausalität in Richtung der Zielgröße noch von einer absoluten Lösung auszugehen ist.
\subsubsection{Ausblick}
Die Bearbeitung der Aufgabenstellung hat aufgezeigt, dass sich das Erarbeiten eines geeigneten \ac{ML}-Prognoseverfahrens im Unternehmensumfeld durchaus als Herausforderung erweisen kann.
Dies liegt zum einen darin begründet, dass sich eine exakte Definition der Prognoseaufgabe als schwierig erweist, wenn bisher kein quantitatives Prognoseverfahren angewandt und dokumentiert wird, sodass ein initialer Prognoseprozess angestoßen werden muss (\acs{vgl} \acs{abschn} \ref{sec:daten}). Dieser erfordert Untersuchungen und Überlegungen in Hinblick auf alle Merkmale, die eine Prognose vollständig definieren (\acs{vgl} \acs{abschn} \ref{fallbeispiel}). Darüber hinaus sollten Zusammenhänge vollständig verstanden werden.
Zum anderen erweist sich die interne sowie externe Datenerhebung, -bereinigung und -integration (\acs{vgl} \acs{kap} \ref{sec:daten}) als äußerst aufwändig, falls Daten nicht zentral und standardisiert gehalten werden. In diesem Zuge könnten geeignete Schnittstellen zu einem geringeren Aufwand beitragen, was mehr Kapazität für die Datenanalyse \acs{bzw} Implementierung von Modellen schaffen und daher vermutlich zu besseren Ergebnissen führen würde. Außerdem könnten Modelle stets anhand aktueller Daten gebildet, evaluiert und validiert werden.
Davon abgesehen kann es in der betrieblichen Praxis grundsätzlich von Vorteil sein, Prognosemodelle nicht in sich geschlossen, sondern innerhalb eines sogenannten \textit{Expert:innensystem} zu implementieren, um die Zugänglichkeit für Anwendende zu vereinfachen, eine Zusammenführung von Expert:innenwissen sowie verschiedener Modelle zu ermöglichen und die innerbetriebliche Akzeptanz zu erhöhen, wie es \textcite{Janetzke2012} beschreiben.
Weiterhin hat sich gezeigt, dass die Modellierung der gewünschten multivariaten \ac{ms}-Prognose mittels \ac{ML} nach der \ac{drs} (\acs{vgl} \acs{kap} \ref{nutzung} \acs{bzw} \acs{abschn} \ref{sec:graphics}), trotz des reichhaltigen Funktionsumfangs frei verfügbarer Softwarebibliotheken, einiges an Programmieraufwand erfordert. Insbesondere das Überführen der gegebenen Zeitreihen in eine Form, welche die Anwendung verfügbarer \acs{ML} Regressionsalgorithmen erlaubt sowie eine Modellierung nach der \ac{drs} sind zum jetzigen Zeitpunkt noch nicht Teil populärer \ac{ML}-Bibliotheken wie \textit{scikit-learn}. An vielversprechenden Ergänzungen wird jedoch beispielsweise in der Bibliothek \textit{sktime} gearbeitet, die eine Implementierung einschlägiger \ac{ML}-Prognosemodelle in Zukunft aufwandsärmer gestalten könnte.
\color{black}
\ No newline at end of file
Vermeiden Sie hier Formulierungen wie \textit{Auf Grund des immer weiter wachsenden Paketvolumens im Onlinehandel und der begrenzt zur Verfügung stehenden Grundstücksflächen müssen Hochregallager immer höher ausgeführt werden}. Diese Formulierung ist nicht nur falsch, sondern auch nichtssagend. Stellen Sie die Motivation Ihrer Arbeit nachvollziehbar dar, ohne sich zu Übertreibungen hinreißen zu lassen.
\color{gray}
Die zu erwartende Nachfrage bestimmter Produkte zu prognostizieren, ist eine der wichtigsten Zielstellungen eines Unternehmens \parencite[\acs{vgl}][6697]{Efendigil2009}, essenziell für die Unternehmensplanung \parencite[\acs{vgl}][6]{Ord2012} und Teil einer modernen \ac{bi} \parencite[\aca{vgl}][1]{Pavlyshenko2019}. Daher existiert eine Vielzahl unterschiedlicher Verfahren, deren Auswahl und Anwendung zumeist spezielle Ressourcen wie mathematische Expert:innen erfordert \parencite[\acs{vgl}][341]{Janetzke2012}, da es sich nicht selten um komplexe Problemstellungen handelt \parencite[\acs{vgl}][1]{Pavlyshenko2019}. Insbesondere \ac{sme} können jedoch die notwendigen Ressourcen oft nicht bereitstellen, weshalb eine Automatisierung dazu beitragen kann, das Nutzer:innenspektrum zu vergrößern \parencite[\acs{vgl}][341]{Janetzke2012}. Diese Automatisierung wird heutzutage durch eine Fülle an frei zugänglichen Open-Source-Softwarebibliotheken erleichtert \parencite[\acs{vgl}][1]{Loening2019}. Während die Implementierung konventioneller statistischer Prognoseverfahren wie der exponentiellen Glättung, \acs{arima} und naiver Methoden, die heutzutage mittels dieser Bibliotheken vergleichsweise einfach umzusetzen ist, jedoch erhebliche Nachteile mit sich bringt, hat sich in einigen Fällen gezeigt, dass Methoden des \acf{ML} bessere Ergebnisse erzielen sowie sich als einfacher in der Anwendung und damit als insgesamt geeigneter erweisen \parencites[\acs{vgl}][3-4]{Brownlee2018}[1-2]{Pavlyshenko2019}. Eine Verallgemeinerung kann diesbezüglich jedoch nicht vorgenommen werden, da es häufig an Signifikanz oder Übertragbarkeit mangelt sowie kein Vergleich zwischen verschiedenen Verfahren gezogen wird und damit die aktuelle Studienlage zu wenig objektive Evidenz liefert \parencite[\acs{vgl}][1-2]{Makridakis2018}. So kommen beispielsweise \textcite{Makridakis2018} in einer umfassenden Studie zu dem Schluss, dass konventionelle statistische Verfahren bessere Ergebnisse als vergleichbare \acs{ML}-Methoden liefern. Dabei wird jedoch nicht der Einfluss berücksichtigt, den externe Größen auf die zu prognostizierende Größe haben könnten. Weiterhin zeigt \textcite{Pavlyshenko2019}, dass \ac{ML}-Methoden zwar unter Berücksichtigung externer Größen annehmbare Ergebnisse erzielen, jedoch beschränkt sich seine Studie auf die Branche des Einzelhandels und es wird kein Vergleich mit konventionellen Prognoseverfahren angestellt. Ähnlich verhält es sich in der Studie von \textcite{Sohrabpour2021}. Im Rahmen dieser Arbeit soll daher in Hinblick auf einen spezifischen Anwendungsfall untersucht werden, inwiefern sich \acs{ML} für die Transportmengenprognose eines mitteleuropäischen Speditionsdienstleisters eignet. Da eine derartige Automatisierung mit zu geringer Transparenz in der Praxis allerdings zu einem Akzeptanz-Problem führen kann \parencite[\acs{vgl}][341]{Janetzke2012}, soll zusätzlich aufgezeigt werden, wie die erhaltene Prognose zustande kommt, respektive welche Größen herangezogen werden und wie groß der jeweilige Einfluss ist.
Es ergeben sich die folgenden Forschungsfragen:
\begin{enumerate}
\item Können Machine-Learning-Methoden in Hinblick auf das Fallbeispiel eine bessere Prognosegüte als konventionelle Prognosemethoden gewährleisten?
\item Welche Einflussfaktoren lassen sich zu welchem Grad anhand einer Machine-Learning-Prognose im Fallbeispiel als relevant identifizieren?
\end{enumerate}
\section{Fallbeispiel}
\label{fallbeispiel}
Das Fallbeispiel wird im Rahmen dieser Arbeit durch die \textit{Elbe-Spedition Else Spahn GmbH} in Dresden dargestellt, welche das größte Unternehmen der \textit{Deutsche Tansport}-Gruppe verkörpert. \textit{Deutsche Transport} ist einer der führenden Logistikunternehmen Europas, beschäftigt über 5200 Mitarbeitende in sechs Ländern Europas und bewegt jährlich über 2.5 Mio. Tonnen per Straße, Schiene, zur Wasser und in der Luft. Die \textit{Elbe-Spedition Else Spahn GmbH} ist auf die Transport per Bahn und Lkw spezialisiert und erzielte damit im Geschäftsjahr 2020 einen Umsatz von 471.2 Mio. Euro \parencite[][]{bundesanzeiger}. Das Produktportfolio umfasst sowohl ad-hoc-Sendungen wieals auch wiederkehrende Transport wie Werksverkehre.
\color{black}
\ No newline at end of file
\section{Performance des Modells}
\label{performance}
Im Rahmen dieser Arbeit wird die Prognosegüte mit dem Begriff der Modellperformance gleichgesetzt. Weitere Kriterien, die bei einer Implementierung in der Praxis eine Rolle spielen könnten, wie der Bedarf eines Modells an Rechen- oder Speicherkapazität, sollen hier nicht explizit berücksichtigt werden.
Von besonderer Relevanz ist es, die Performance verschiedener Prognosemodelle in Relation zu bewerten \parencite[\acs{vgl}][2]{Makridakis2018}, wie es beispielsweise \textcite{Ahmed2010} und \textcite{Makridakis2018} demonstrieren. In diesem Abschnitt werden nachfolgend die, für eine relative Bewertung zusätzlich herangezogenen, Modelle sowie die Bewertungskriterien vorgestellt und im Anschluss die Ergebnisse präsentiert.
\subsection{Vergleichsmodelle}
\label{vergleichsmodelle}
Als \textit{naive Prognosemethoden} können alle univariaten Ansätze bezeichnet werden, die eine vergleichsweise einfache Funktion zur Prognose verwenden, wie einen linearen Trend \parencite[\acs{vgl}][116]{Chatfield2019}, die direkte Extrapolation oder einen Mittelwert der letzten Beobachtungswerte \parencite[\acs{vgl}][172]{Brownlee2018}. Für eine erste Einschätzung hinsichtlich der Performance komplexerer Modelle empfiehlt sich der Vergleich mit mindestens einer naiven Methode \parencite[\acs{vgl}][172]{Brownlee2018}, wie sie beispielsweise auch in der \textit{M4-Competition} \parencite[\acs{vgl}][]{Makridakis2018a} als Benchmark angeführt wird.
Hier werden die folgenden naiven Methoden herangezogen, zwecks Unterscheidbarkeit benannt und mittels der Klasse \verb+NaiveForecaster+ in \textit{sktime} implementiert:
\begin{itemize}
\item Bei der Methode \textbf{Naive Last} wird der letzte Beobachtungswert in den Prognosehorizont extrapoliert\footnote{Diese Vorgehensweise basiert auf dem Random-Walk-Modell \parencite[\acs{vgl}][47]{Chatfield2019}.}.
\item Die Methode \textbf{Naive Seasonal} generiert den Prognosewert durch den letzten Beobachtungswert des selben Saisonzeitpunktes \parencite[\acs{vgl}][]{Hyndman2018}. Beispielsweise wird als Prognosewert für den Januar 2019, der Beobachtungswert aus dem Januar 2018 festgelegt.
\item Nach der Methode \textbf{Naive Rolling Mean} wird der gleitende Mittelwert der letzten $n$ Beobachtungswerte in den Prognosehorizont extrapoliert. Hier wird $n$ auf 12 festgelegt, da dies einer saisonalen Periode entspricht.
\end{itemize}
\subsection{Bewertungskriterien}
\label{fehlermaße}
Um die Performance der verglichenen Prognosemodelle zu quantifizieren, wird das gängige Fehlermaß \ac{smape} herangezogen und nachfolgend erläutert. Die dabei verwendeten Symbole sind:
\begin{itemize}
\item $y$: Beobachtungswerte,
\item $\hat{y}$: Prognosewerte,
\item $n$: Anzahl an Samples,
\item $T$: letzter Zeitpunkt der betrachteten Zeitreihe,
\item $y_{naiv}$: Prognosewerte einer naiven Prognose.
\end{itemize}
\subsubsection{Ungleichheitskoeffizient von Theil}
\label{tuk}
Der \ac{smape} errechnet sich wie folgt \parencite[\acs{vgl}][5]{Makridakis2018}:
\begin{equation*}
sMAPE = \frac{2}{n}\sum_{i=1}^{T}\left\lvert \frac{\hat{y}_t - y_t}{(\hat{y}_t + y_t)} \right\lvert \times 100 \%
\end{equation*}
%
und wird in der Literatur zur Prognose von Zeitreihen immer wieder herangezogen, insbesondere zum Vergleich der Performance verschiedener Modelle. Als Beispiele können \textcite{Makridakis2000}, \textcite{Ahmed2010} und \textcite{Makridakis2018} genannt werden.
\subsection{Ergebnisse}
\label{sec:ergebnisse}
Um eine Auswertung in Hinblick auf die Performance vornehmen zu können, werden die beschriebenen Vergleichsmodelle anhand der Restkomponente der Zielgröße (\acs{vgl} \acs{abschn} \ref{sec:docs}) gebildet. Anschließend werden die mittels \acs{wfv} (\acs{vgl} \acs{abschn} \ref{sec:graphics}) generierten Prognosewerte mit der Saison- und Trendkomponente beaufschlagt, um Vergleichbarkeit zu gewährleisten. Die sich ergebenden Prognosen sind in Anhang \ref{softwarearchitektur} zu finden. Die quantitative Bewertung der Performance ist in \acs{tab.} \ref{tab_results} abzulesen.
\begin{table}[ht]
\centering
\renewcommand{\arraystretch}{1.4}
\caption{Relative quantitative Auswertung der Modellperformance.}
\vspace*{4mm}
\begin{tabular}{lcc}
\toprule
Modell & sMAPE [\%] \\
\midrule
ML Multiv. & 31.55 \\
Naive Seas. & 33.29 \\
Naive Roll. Mean & 34.27 \\
Naive Last & 42.61 \\
\bottomrule
\end{tabular}
\label{tab_results}
\end{table}
\ No newline at end of file
Dieses Kapitel beschreibt den Aufbau und die Nutzung dieser LaTeX-Vorlage. Die Vorlage basiert auf dem TUD-Script-Bundle \emph{tudscr} zur Erstellung von Dokumenten im Corporate Design der TU Dresden. Weiterführende Nutzungshinweise sind daher im Handbuch dieses Bundles zu finden \textcite{hanisch2022}.
\section{Ordnerstruktur der Vorlage}
\section{Anpassung der Vorlage für Ihre Arbeit}
\label{sec:anpassung}
\subsection{Daten zur Arbeit}
\label{sec:daten}
\subsection{Kapitelstruktur}
\label{sec:struktur}
\section{Einfügen von Dokumenten}
\label{sec:docs}
\section{Einfügen von Grafiken}
\label{sec:graphics}
\ No newline at end of file
\color{gray}
Sobald ein Modell für die gegebene Prognoseaufgabe gebildet \acs{bzw} ausgewählt ist, sollte überprüft werden, ob dieses die Zusammenhänge in den Daten tatsächlich angemessen abbilden kann. Ähnlich zu den meisten statistischen Methoden wird diese Überprüfung üblicherweise durch eine Analyse der Residuen \acs{bzw} Abweichungen
\begin{equation}
e_t = y_t - \hat{y}_t
\end{equation}
vorgenommen, die sich aus der Differenz zwischen dem Beobachtungswert $y$ und dem Prognosewert $\hat{y}$ zu einem bestimmten Zeitpunkt $t$ ergeben. Da es sich hier um ein Zeitreihen-Modell handelt, sollten auch dessen Abweichungen als Zeitreihe betrachtet werden. \parencites[\acs{vgl}][61-62]{James2013}[59]{Vogel2015}[107]{Chatfield2019}.
Ist das Modell valide, weisen dessen Abweichungen die Charakteristik eines weißen Rauschens auf und erfüllen damit die folgenden vier Prämissen \parencites[\acs{vgl}][59]{Vogel2015}[]{Hyndman2018}[107]{Chatfield2019}:
\begin{enumerate}
\item Die Abweichungen schwanken um einen konstanten Mittelwert nahe null.
\item Die Varianz verhält sich konstant.
\item Die Verteilung genügt einer Normalverteilung.
\item Es sind keine signifikanten Autokorrelationen vorhanden \acs{bzw} die Abweichungen sind zeitlich unabhängig voneinander.
\end{enumerate}
Eine Beurteilung des Modells \acs{bzw} der Abweichungen, in Hinblick auf diese Prämissen soll hier als \textit{Validierung} bezeichnet werden. Diese wird üblicherweise durchgeführt, indem die Abweichungen durch verschiedene Plots visualisiert werden \parencites[\acs{vgl}][99]{Kuhn2013}[107]{Chatfield2019}. Ist eine der genannten Voraussetzungen nicht gegeben, enthalten die beobachteten Abweichungen Restinformationen, die zur weiteren Verbesserung des Modells dienlich sein können \parencite[\acs{vgl}][]{Hyndman2018}. Die Validierung wird hier anhand des Test-Sets (\acs{vgl} \acs{abschn} \ref{sec:docs}) nachfolgend vorgenommen. Dafür werden 16 \ac{ms}-Prognosen nach der \acs{wfv} (\acs{vgl} \acs{abschn} \ref{sec:docs}) generiert und mit der Saison- sowie Trendkomponente (\acs{vgl} \acs{abschn} \ref{sec:docs}) beaufschlagt, wie es auch \textcite[10]{Makridakis2018} beschreiben. Diese Prognosen sind in \acs{Abb} \ref{sec:docs} dargestellt. Unter Berücksichtigung der Prognosewerte aller Teil-Modelle ergeben sich anhand der Beobachtungswerte im Test-Set 48 Abweichungen, die repräsentativ für das übergeordnete \acs{ms}-Modell betrachtet werden. Weiterhin ist zu beachten, dass im Rahmen dieser Validierung nur festgestellt, jedoch nicht nachgebessert werden kann, da in diesem Zuge neue Daten gesammelt werden müssten (\acs{vgl} \acs{abschn} \ref{sec:docs}), was jedoch den Rahmen dieser Arbeit überstiege.
\begin{figure}[ht]
\centering
\includegraphics[width=\textwidth]{graphics/fig_result_pred.pdf}
\caption[Prognose des zu validierenden Modells.]{Prognosewerte des zu validierenden Machine-Learning-Modells im Test-Set. Jede Prognose besteht aus drei Schritten und ist in einer anderen Farbe dargestellt. Die gestrichelte vertikale Linie markiert den Beginn des Test-Sets und die gepunktete graue Zeitreihe die Beobachtungswerte.}
\label{fig_result_pred}
\end{figure}
\section{Normalverteilung}
Um die Abweichungen auf Ähnlichkeit zu einer Normalverteilung zu überprüfen, wird sowohl ein qualitativer als auch ein quantitativer Test durchgeführt.
Als qualitativer Test kann ein \ac{qqp} dienen, indem die empirischen Quantile der Abweichungen gegen die entsprechenden Quantile einer Normalverteilung aufgetragen werden. Sind die Abweichungen normalverteilt, liegen alle Punkte des Plots auf einer Geraden \parencite[\acs{vgl}][66-67]{Vogel2015}.
Ein \ac{qqp} wird hier mittels der Klasse \verb+qqplot+ in \textit{statsmodels} erstellt und ist in \acs{Abb} \ref{fig_qq} dargestellt. Es ist ersichtlich, dass die einzelnen Punkte näherungsweise auf der abgebildeten Geraden liegen und die Abweichungen demnach einer Normalverteilung genügen.
\begin{figure}[h]
\centering
\includegraphics[width=\textwidth]{graphics/fig_qq.pdf}
\caption[\acl{qqp}.]{\acl{qqp} der standardisierten, unzentrierten Abweichungen. Die schwarze Linie stellt eine ideale Normalverteilung dar.}
\label{fig_qq}
\end{figure}
Als quantitativer Test wird die Teststatistik von \textcite{DAgostino1973} herangezogen, die in \textit{scipy} mit der Klasse \verb+normaltest+ implementiert ist. Der sich ergebende p-Wert von 0.47 übersteigt das festgelegte Signifikanzniveau $\alpha$ von 0.05, wodurch die Annahme normalverteilter Abweichungen bestätigt wird.
\section{Fit des Modells}
Vor einer Validierung anhand der Abweichungen kann ein Plot der Beobachtungswerte gegen die Prognosewerte bei der Beurteilung der Modellanpassung (Fit) helfen \parencite[\acs{vgl}][99]{Kuhn2013}. Dieser ist in \acs{Abb} \ref{fig_obs_vs_pred} zu sehen. Der Winkelversatz zwischen der linearen Best-Fit Linie und einer theoretischen, positiven Korrelation kann als Maß für ein Defizit bezüglich des Fits herangezogen werden.
\begin{figure}[ht]
\centering
\includegraphics[width=\textwidth]{graphics/fig_obs_vs_pred.pdf}
\caption[Fit des Modells.]{Beobachtungswerte über die Prognosewerte. Die durchgängige schwarze Linie bildet den linearen Best-Fit und die gestrichelte stellt eine perfekte Korrelation dar.}
\label{fig_obs_vs_pred}
\end{figure}
Dieses Dokument stellt ein Grundgerüst für die Erstellung von Studien- und Abschlussarbeiten an der Professur für Technische Logistik dar.
Der Abstract soll in aussagekräftiger Form die gesamte Arbeit beschreiben. Das Ziel, thematischer Umfang und thematische Abgrenzung, verwendete Methoden, erreichte Ergebnisse sowie Schlussfolgerungen sollen im Abstract zusammengefasst werden. Im Rahmen der Studienarbeit soll der Abstract maximal 300 Wörter umfassen.
\nextabstract[language=english]
Der Abstract ist auch in englischer Sprache zu verfassen.
\ No newline at end of file
\DeclareAcronym{ML}{
short = ML,
long = Machine Learning
}
\DeclareAcronym{FS}{
short = FS,
long = Feature Selection
}
\DeclareAcronym{FE}{
short = FE,
long = Feature Engineering
}
\DeclareAcronym{Abb}{
short = Abb.,
long = Abbildung,
tag=hide
}
\DeclareAcronym{EVA}{
short = EVA,
long = {Eingabe, Verarbeitung und Ausgabe}
}
\DeclareAcronym{ggf}{
short = ggf.,
long = gegebenenfalls,
tag=hide
}
\DeclareAcronym{abschn}{
short=Abschn.,
long=Abschnitt,
tag=hide
}
\DeclareAcronym{S.}{
short=S.,
long=Seite,
tag=hide
}
\DeclareAcronym{KW}{
short=KW,
long=Kalenderwoche
}
\DeclareAcronym{BS}{
short=BS,
long=Baustahl-Stab
}
\DeclareAcronym{vgl}{
short=vgl.,
long=vergleiche,
tag=hide
}
\DeclareAcronym{bzw}{
short=bzw.,
long=beziehungsweise,
tag=hide
}
\DeclareAcronym{usa}{
short=USA,
long=Unites States of America,
tag=hide
}
\DeclareAcronym{Gl.}{
short=Gl.,
long=Gleichung,
tag=hide
}
\DeclareAcronym{mts}{
short=MTS,
long=Lagerfertigung,
foreign=make to stock
}
\DeclareAcronym{kap}{
short=Kap.,
long=Kapitel,
tag=hide
}
\DeclareAcronym{idr}{
short=i. d. R.,
long=in der Regel,
tag=hide
}
\DeclareAcronym{s}{
short=s.,
long=siehe,
tag=hide
}
\DeclareAcronym{dl}{
short=DL,
long=Data-Leakage
}
\DeclareAcronym{oos}{
short=OOS,
long=Out-Of-Sample
}
\DeclareAcronym{cv}{
short=CV,
long=Cross-Validation
}
\DeclareAcronym{wfv}{
short=WFV,
long=Walk-Forward-Validation
}
\DeclareAcronym{tuk}{
short=TUK,
long=Ungleichheitskoeffizient von Theil
}
\DeclareAcronym{ann}{
short=ANN,
long=künstliche neuronale Netze,
foreign=artificial neural networks
}
\DeclareAcronym{os}{
short=OS,
long=Ein-Schritt,
foreign=one-step
}
\DeclareAcronym{ms}{
short=MS,
long=Mehr-Schritt,
foreign=multi-step
}
\DeclareAcronym{sfg}{
short=SFG,
long=Sequential-Forward-Generation
}
\DeclareAcronym{sbg}{
short=SBG,
long=Sequential-Backward-Generation
}
\DeclareAcronym{vt}{
short=VT,
long= Variance-Thresholding
}
\DeclareAcronym{ulr}{
short=ULR,
long=Univariate-Linear-Regression
}
\DeclareAcronym{rfe}{
short=RFE,
long=Recursive-Feature-Elimination
}
\DeclareAcronym{rs}{
short=RS,
long=Rekursiv-Strategie
}
\DeclareAcronym{ds}{
short=DS,
long=Direkt-Strategie
}
\DeclareAcronym{drs}{
short=DRS,
long=Direkt-Rekursiv-Strategie
}
\DeclareAcronym{mos}{
short=MOS,
long=Multi-Output-Strategie
}
\DeclareAcronym{sm}{
short=SM,
long=Step-Model,
long-plural=s
}
\DeclareAcronym{rf}{
short=RF,
long=Random Forest
}
\DeclareAcronym{gs}{
short=GS,
long=Grid-Search
}
\DeclareAcronym{engl}{
short=engl.,
long=englisch,
tag=hide
}
\DeclareAcronym{tab.}{
short=Tab.,
long=Tabelle,
tag=hide
}
\DeclareAcronym{qqp}{
short=Q-Q-Plot,
long=Quantile-Quantile-Plot
}
\DeclareAcronym{acf}{
short=ACF,
long=Autokorrelationsfunktion,
foreign=autocorrelation function
}
\DeclareAcronym{arima}{
short=ARIMA,
long=autoregressiver integrierter gleitender Durchschnitt,
foreign=autoregressive integrated moving average
}
\DeclareAcronym{arimax}{
short=ARIMAX,
long=autoregressiver integrierter gleitender Durchschnitt mit exogenen Variablen,
foreign=autoregressive integrated moving average with exogenous variables
}
\DeclareAcronym{rmse}{
short=RMSE,
long=Root-Mean-Squared-Error,
long-plural=s
}
\DeclareAcronym{mase}{
short=MASE,
long=Mean-Absolute-Scaled-Error
}
\DeclareAcronym{mae}{
short=MAE,
long=Mean-Absolute-Error,
long-plural=s
}
\DeclareAcronym{smape}{
short=sMAPE,
long=Symmetric-Mean-Absolute-Percentage-Error,
long-plural=s
}
\DeclareAcronym{erp}{
short=ERP,
long=Enterprise-Resource-Planning
}
\DeclareAcronym{bi}{
short=BI,
long=Business Intelligence
}
\DeclareAcronym{sme}{
short=KMU,
long=kleine und mittelständische Unternehmen
}
\DeclareAcronym{esf}{
short=ESF,
long=ESF Elbe-Stahlwerke Feralpi GmbH
}
\DeclareAcronym{lkw}{
short=LKW,
long=Lastkraftwagen
}
\DeclareAcronym{gj}{
short=GJ,
long=Geschäftsjahr
}
\DeclareAcronym{WR}{
short=WR,
long=warmgewalzte Ringe
}
\DeclareAcronym{etf}{
short=ETF,
long=Exchange-Traded-Fund
}
\DeclareAcronym{api}{
short=API,
long=Programmierschnittstelle,
foreign=application programming interface
}
\DeclareAcronym{pca}{
short=PCA,
long=Hauptkomponentenanalyse,
foreign=principal component analysis
}
\DeclareAcronym{coreq}{
short=COREQ,
long=Consolidated criteria for reporting qualitative research
}
\ No newline at end of file
Diese Arbeit basiert auf vertraulichen, internen Daten der Firma \textit{\getfield{company}} und darf aus diesem Grund ohne Zustimmung des Verfassers und der Firma \textit{\getfield{company}} nicht von Dritten – mit Ausnahme der wissenschaftlichen Betreuer bzw. der damit beauftragten wissenschaftlichen Mitarbeiter im Prüfungsverfahren, den Prüfern, den Mitgliedern des Prüfungsausschusses sowie den mit der Abwicklung des Prüfungsverfahrens befassten Hochschulbediensteten und im Falle einer rechtlichen Auseinandersetzung dem Justitiariat der TU Dresden, damit befassten Rechtsanwälten, Gutachtern und Gerichten – eingesehen werden. \newline \newline Dieser Sperrvermerk endet am
\ No newline at end of file
\KOMAoptions{fontsize=11} % Schriftgröße für Title und Task
\setstretch{1} % Zeilenabstand für Title und Task
\input{title}
\includepdf{enclosed_documents/Aufgabenstellung.pdf}
\setstretch{1.3} % Vorgabe Zeilenabstand
\KOMAoptions{fontsize = 12} % Vorgabe Schriftgröße
\begin{abstract}[abstract=true, abstract=notoc, abstract=multiple]
\input{/abstract}
\end{abstract}
\begin{declarations}
% Eidesstattliche Erklärung
\confirmation
% Sperrvermerk (optional, wenn nicht benötigt auskommentieren/löschen)
\company{Elbe-Spedition Else Spahn GmbH} % Firma, deren Daten geschützt werden sollen
\nextdeclaration{Sperrvermerk}{\input{blocking}
31. Juni 2027. % Ablauf des Sperrvermerks, max. 5 Jahre nach Abgabedatum
}
\end{declarations}
\tableofcontents
\newpage
\pagenumbering{Roman}
\setcounter{page}{1}
\phantomsection
\addcontentsline{toc}{chapter}{\listfigurename}
\listoffigures
\printacronyms[exclude=hide, template=supertabular]
\addchap{Vorbemerkung}
\input{vorbemerkung}
\ No newline at end of file
% Zunächst wird der Typ der Arbeit festgelegt. möglich sind u.a.
% diploma
% master
% bachelor
% project
% seminar
\thesis{diploma}
% Abgabedatum
\date{30.06.2023}
% Bei Abschlussarbeiten wird hier der angestrebte Titel angegeben
\graduation[Dipl.-Ing.]{Diplomingenieurin}
% Ihre persönlichen Daten
\author{
Lola Logistik
\dateofbirth{20.03.2000}
\placeofbirth{Pirna}
\matriculationnumber{1234567}
\course{Maschinenbau}
\discipline{Produktionstechnik}
\matriculationyear{2020}
\emailaddress{lola.logistik@tu-dresden.de}
}
% Der Titel Ihrer Arbeit
\title{Latex-Vorlage für Studien- und Abschlussarbeiten an der Professur für Technische Logistik}
% Die Name der Person(en), die Ihre Arbeit fachlich begleiten
\supervisor{Frau Dipl.-Ing. Marta Materialfluss \and Herr Dipl.-Wi.-Ing. Simon Simulation}
\professor{Herr Prof. Dr.-Ing. Thorsten Schmidt}
\faculty{Fakultät Maschinenwesen}
\institute{Institut für Technische Logistik und Arbeitssysteme}
\chair{Professur für Technische Logistik}
\pagenumbering{roman}
\setcounter{page}{1}
\maketitle[headlogo = graphics/TL_Logo]
\ No newline at end of file
In diesem Abschnitt können Sie einleitenden Bemerkungen zu Ihrer Arbeit aufführen, die die Lektüre vereinfachen. Sie führen hier beispielsweise Konventionen auf, die Sie in Ihrem Text befolgen. Die folgenden Abschnitte dienen als Beispiele. Der Beispieltext ist hier wie im gesamten Dokument grau gehalten.
\color{gray}
Aufgrund der Nutzung der englischen Sprache im Programmcode, wird in dieser Arbeit grundsätzlich der Punkt als Dezimaltrennzeichen und ein Komma als Tausendertrennzeichen verwendet. Mathematische Definitionen und Symbole sollen vornehmlich dem Verständnis einzelner Zusammenhänge sowie Textpassagen dienen und behalten abgesehen von Querverweisen lediglich innerhalb der übergeordneten Ebene (Kapitel oder Abschnitt) ihre Gültigkeit. Außerdem werden der englischen Sprache entstammende, allgemein als etabliert und geläufig angesehene Fachbegriffe ihrer deutschen Übersetzung vorgezogen.
Die Literaturverweise erfolgen nach \citetitle{DIN_ISO_690} \parencite{DIN_ISO_690} und zur genderinklusiven Kommunikation wird \citetitle{TUD2021} \parencite{TUD2021} berücksichtigt.
\color{black}
\ No newline at end of file
File added
\documentclass[ngerman]{tudscrreprt}
\iftutex
\usepackage{fontspec}
\else
\usepackage[T1]{fontenc}
\usepackage[ngerman=ngerman-x-latest]{hyphsubst}
\fi
\usepackage{babel}
\usepackage{isodate}
\usepackage{tudscrsupervisor}
\usepackage{enumitem}\setlist{noitemsep}
\begin{document}
\renewcaptionname{ngerman}{\supervisorname}{Ansprechpartner}
\renewcaptionname{ngerman}{\chairmanname}{Studienrichtungsleiter}
\renewcaptionname{ngerman}{\objectivesname}{Zielsetzung der Arbeit}
\thesis{diploma}
\graduation[Dipl.-Ing.]{Diplomingenieur}
\faculty{Fakultät Maschinenwesen}
\institute{Institut für Technische Logistik und Arbeitssysteme}
\chair{Professur für Technische Logistik}
\author{
Lola Logistik
\dateofbirth{20.03.2003}
\placeofbirth{Pirna}
\matriculationnumber{1234567}
\course{Maschinenbau}
\emailaddress{lola.logistik@tu-dresden.de}
}
\title{LaTeX-Vorlage für Studien- und Abschlussarbeiten an der Professur für Technische Logistik}
\professor{Herr Prof. Dr.-Ing. Thorsten Schmidt}
\chairman{Herr Prof. Dr.-Ing. Uwe Füssel}
\supervisor{Frau Dipl.-Ing. Marta Materialfluss \and Herr Dipl.-Wi.-Ing. Simon Simulation}
\thesis{diploma}
\issuedate{1.2.2023}
\duedate{2.7.2023}
\taskform{Mit einer LaTeX-Vorlage werden sowohl die Erstellung als auch die Bewertung und Betreuung einer wissenschaftlichen Arbeit erleichtert. Die Arbeit soll sowohl als Vorlage dienen können und die Richtlininen zur Erstellung einer wissenschaftlichen Arbeit an der Professur für Technische Logistik abbilden.}
{
\item Welche Richtlinien sind bei der Erstellung einer wiss. Arbeit an der Professur zu befolgen?
\item Was ist bei der Nutzung der LaTeX-Vorlage zu beachten?
\item Welche Tools stehen zur Versionierung/Sicherung des Arbeiitsstandes zur Verfügung?
\item Wie können diese Tools die Betreuung der Arbeit verbessern?
}
\end{document}
\ No newline at end of file
File added
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment