BERT ist das mächtigste Sprachmodell, von Google entwickelt, das im Bereich von Natural Language Processing zum Einsatz kommt. In den vergangenen Jahren wurden einige domain-specific "BERT"-Modelle entwickelt, beispielsweise BioBERT, ClinicalBERT oder FinBERT, um den Anforderungen der einzelnen Wirtschaftsbereiche besser gerecht zu werden. Nun gibt es mit TourBERT auch ein Modell für die Tourismusbranche.
FH-Prof. Mag. Dr. Roman Egger - Senior Lecturer und Fachbereichsleiter eTourism am Studiengang Innovation & Management in Tourism - hat gemeinsam mit Veronika Arefievea von der JKU Linz nun "TourBERT" entwickelt. "Seit eineinhalb Jahren arbeiten wir intensiv an 'TourBERT'. TourBERT wurde auf einem tourismusspezifischen Text Corpus von über 3,5 Millionen Dokumenten in einer Million steps trainiert. Im Rahmen von tourismusspezifischen Tests, schlägt TourBERT das original Modell BERT in allen Bereichen."
Breite Einsatzgebiete in Wirtschaft und Tourismus
Damit ist den beiden Wissenschaftern ein ein Coup gelungen. Roman Egger: "Wir hoffen, dass die Wirtschaft TourBERT für ihre Natural Language Processing Projekte einsetzten wird." TourBERT steht als Open Source auf 'Hugging Face' - einem Hub für Sprachmodelle - zur Verfügung und wurde bereits am Tag der Veröffentlichung über 500 mal downgeloadet.
Interessierte können das Paper nachlesen: https://arxiv.org/abs/2201.07449 Weitere Publikationen in Fachjournals sind geplant.
Weitere Infos unter: http://www.datascience-in-tourism.com/?p=461