Multirelationale Faktorisierungsmodelle
Zusammenfassung der Projektergebnisse
Das Projekt „Multirelationale Tensorfaktorisierung“ befasste sich mit Tensorfaktorisierungs-Modellen für multirelationale Daten, welche üblicherweise Interaktionen zwischen Objekten vorhersagen, über die nur wenige Beobachtungen gemacht wurden. Die üblichen Anwendungsbeispiele finden sich in Empfehlungssystemen im E-Commerce und in sozialen Netzwerken, da hier oft viele Relationen zwischen Objekten vorhanden sind. Ziel dieses Projekts war eine systematische Untersuchung von Tensorfaktorisierungs-Modellen in multirelationalen Szenarien. Darüber hinaus sollte untersucht werden, inwiefern zusätzliche Relationen neben der Zielrelation regularisierend auf das Lernen des Modells für die Zielrelation einwirken. Im Laufe des Projekts wurde dieses Ziel erweitert, indem die Frage beantwortet wird, wie Modelle für mehrere Zielrelationen gleichzeitig optimiert werden können und dennoch ein Austauschen der Modellparameter bewerkstelligt werden kann, um eine schnellere Konvergenz und den oben beschriebenen Regularisierungseffekt zu erhalten. Im Ergebnis des Projekts wurden die obigen Ziele realisiert: • Der systematische Vergleich von Tensorfaktorisierungs-Modellen für eine höherstellige Relation wurde anhand des Beispiels von RDF-Datenbanken realisiert und erweitert. • Der regularisierende Einfluss von Hilfsrelationen wurde in mehreren Anwendungsfällen nachgewiesn und benutzt, um das Cold-Start-Problem zu umgehen, sowie auf teilweise überwachte Lernprobleme angewandt, indem die Nachbarschaftsrelation zwischen einzelnen Instanzen faktorisiert wird. • Die Frage, wie Tensorfaktorisierungs-Modelle für mehrere Zielvariablen optimiert werden können, wurde umfassend in Form einer neuen Modellklasse beantwortet, die genügend eigene Parameter lernt, um die Zielrelationen mit hoher Vorhersagegüte zu prädizieren, dabei aber Parameter über alle Hilfsrelationen teilt, um eine schnelle Konvergenz zu gewährleisten. Darüber hinaus wurden zusätzliche Ziele erfüllt, die nicht Bestandteil des initialen Projektantrags waren, darunter findet sich eine geeignete Lernstrategie für Faktorisierungs-Modelle für sich kontinuierlich ändernde Datenstreams, am Beispiel von Twitter-Daten. Zusammenfassend lässt sich sagen, dass wir all unsere für das Projekt gesetzten Ziele vollständig erreicht haben.
Projektbezogene Publikationen (Auswahl)
-
(2011): Multi- Relational Factorization Models for Predicting Student Performance, in KDD 2011 Workshop on Knowledge Discovery in Educational Data (KDDinED 2011). Held as part of the 17th ACM SIGKDD Conference on Knowledge Discovery and Data Mining
Nguyen Thai-Nghe, Lucas Drumond, Tomáš Horváth, Lars Schmidt-Thieme
-
(2012): Multi-Relational Matrix Factorization using Bayesian Personalized Ranking for Social Network Data, Proceedings of the Fifth ACM International Conference on Web Search and Data Mining
Artus Krohn-Grimberghe, Lucas Drumond, Christoph Freudenthaler, Lars Schmidt-Thieme
-
(2012): Predicting RDF Triples in Incomplete Knowledge Bases with Tensor Factorization, in Proceedings of the 27th ACM International Symposium on Applied Computing, Riva del Garda, Italy
Lucas Drumond, Steffen Rendle, Lars Schmidt-Thieme
-
(2012): What is Happening Right Now ... That Interests Me? Online Topic Discovery and Recommendation in Twitter, Proceedings of the 21st ACM International Conference on Information and Knowledge Management (CIKM 2012)
Ernesto Diaz-Aviles, Lucas Drumond, Zeno Gantner, Lars Schmidt-Thieme, Wolfgang Nejdl
-
(2014): Collective Matrix Factorization of Predictors, Neighborhood and Targets for Semisupervised Classification, in Advances in Knowledge Discovery and Data Mining - 18th Pacific-Asia Conference (PAKDD 2014), Tainan, Taiwan
Lucas Drumond, Lars Schmidt-Thieme, Christoph Freudenthaler, Artus Krohn-Grimberghe
-
(2014): Optimizing Multi-Relational Factorization Models for MultipleTarget Relations, in Proceedings of the 23rd ACM International Conference on Information and Knowledge Management (CIKM 2014), Shanghai, China
Lucas Drumond, Ernesto Diaz-Aviles, Lars Schmidt-Thieme, Wolfgang Nejdl