Benutzer:Rhingdrache/Philipp Koehn

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Philipp Koehn (* 1. August 1971 in Erlangen) ist ein deutscher Wissenschaftler, der sich vorwiegend mit statistischer Maschineller Übersetzung (einem Teilgebiet der Computerlinguistik) beschäftigt. Er ist Begründer und neben Hieu Hoang Hauptentwickler des Open Source-Übersetzungssystems Moses.

Leben[Bearbeiten | Quelltext bearbeiten]

Philipp Koehn studierte an der University of Tennessee (Master-Abschluss 1994) und an der Universität Erlangen (Diplom 1996). Sein Promotionsstudium mit Ph.D.-Abschluss (2003) machte er an der University of Southern California. Nach einem Jahr als Postdoktorand am Massachusetts Institute of Technology, arbeitete er ab 2005 an der University of Edinburgh als Hochschullehrer (Lecturer, ab 2010 Reader), seit 2012 als Professor. 2014 wurde er zum Professor am Computer Science Department der Johns Hopkins University berufen.[1]

Philipp Koehn ist verheiratet mit Trishann Koehn und hat zwei Kinder, Phianna und Leo.

Leistungen[Bearbeiten | Quelltext bearbeiten]

Moses Machine Translation Decoder[Bearbeiten | Quelltext bearbeiten]

Der Moses Machine Translation Decoder ist eine Open-Source-Plattform zur Entwicklung von Systemen zur statistischen maschinellen Übersetzung und Teil des Moses Machine Translation Toolkits. Die Entwicklung der Plattform steht unter der Leitung von Philipp Koehn, der auch das Projekt begründet hat.[2] Die Hauptentwicklung fand an der University of Edinburgh durch Koehn und Hieu Hoang statt.

Unterstützt wurde und wird die Entwicklung von den folgenden Projekten des sechsten und siebten Frameworks der EU: EuroMatrix, TC-Star, EuroMatrixPlus, Let’s MT, META-NET und MosesCore, sowie vom DARPA GALE Projekt und diversen Universitäten wie die University of Edinburgh, der University of Maryland, dem ITC-irst und dem Massachusetts Institute of Technology.

Moses ist die Grundlage für viele (auch kommerzielle) Angebote zur maschinellen Übersetzung und kann als Maßstab für heutige Entwicklungen auf dem Gebiet der maschinellen Übersetzung gesehen werden.

Europarl Corpus[Bearbeiten | Quelltext bearbeiten]

Der Europarl Corpus ist eine Sammlung von Sitzungsberichten des Europäischen Parlaments seit 1996. Die Inhalte des mehrsprachigen Textkorpus sind satzweise aligniert. Aufgebaut wurde der Korpus von einer Forschergruppe an der University of Edinburgh unter der Leitung von Koehn.

Die aktuelle Version (v7) ist von 2012 und enthält ungefähr 60 Millionen Wörter pro Sprache.[3] Die enthaltenen 21 Sprachen sind: Französisch, Italienisch, Spanisch, Portugiesisch, Rumänisch, Englisch, Niederländisch, Deutsch, Dänisch, Schwedisch, Bulgarisch, Tschechisch, Polnisch, Slowakisch, Slowenisch, Finnisch, Ungarisch, Estnisch, Lettisch, Litauisch und Griechisch.

Auszeichnungen[Bearbeiten | Quelltext bearbeiten]

2015 erhielt Koehn den IAMT Award of Honor[4].

Veröffentlichungen (Auszug)[Bearbeiten | Quelltext bearbeiten]

  • Combining Genetic Algorithms and Neural Networks. Master-Thesis, University of Tennessee. Knoxville, USA. 1994. online
  • Statistische und modellbasierte Lernverfahren zur Erweiterung von Unifikationsgrammatiken. Diplomarbeit, Friedrich-Alexander-Universität Erlangen-Nürnberg. Erlangen. 1996. online
  • Noun Phrase Translation. PhD thesis, University of Southern California. Los Angeles. 2003. online
  • Philipp Koehn, Franz Josef Och, and Daniel Marcu. "Statistical Phrase-Based Translation". In: Proceedings of the North American Chapter of the Association for Computational Linguistics on Human Language Technology. (Vol. 1). S. 48-54. Association for Computational Linguistics. 2003. online
  • "Pharaoh: a Beam Search Decoder for Phrase-Based Statistical Machine Translation Models". In: Conference of the Association for Machine Translation in the Americas. S. 115-124. Springer. Berlin, Heidelberg. 2004. online
  • "Europarl: A Parallel Corpus for Statistical Machine Translation". In: MT summit. (Vol. 5). S. 79-86. 2005. online
  • Philipp Koehn, et. al. "Moses: Open Source Toolkit for Statistical Machine Translation". In: Final Report of the 2006 JHU Summer Workshop. S. 177-180. Association for Computational Linguistics. Prag. 2007. online
  • Statistical Machine Translation. Cambridge University Press. 2010.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Lebenslauf und Veröffentlichungen von Philipp Koehn
  2. Moses Manual
  3. Europarl Home Page
  4. IAMT Award of Honor