Computerlinguistik

Inhalt des Studiums
Inhalte und Aufbau des Studiums
Forschungsumfeld der Computerlinguistik
Formalia
Fachstudienberatung
Kontakt
Studienabschluss: | Bachelor of Arts |
Bewerbungspflichtig: | Nein |
Studienbeginn: | WS u. SS |
Regelstudienzeit: | 6 |
Prozentstruktur: | 100%; 75%; 50%; 25% |
Sprachnachweise: |
100%/75%/50%: Kenntnisse der englischen Fachsprache und einer weiteren historischen oder modernen Fremdsprache 25%: Englisch |
Lehrsprache: | Deutsch und Englisch |
Akkreditierung: |
Der Studiengang hat das universitätseigene Akkreditierungsverfahren erfolgreich durchlaufen. Akkreditierungsurkunde |
Fakultät: |
Inhalt des Studiums
Computerlinguistik ist ein interdisziplinäres Fach. Es untersucht, wie natürliche Sprache durch formale Modellierung, algorithmische Verfahren der Informatik und statistische Verfahren automatisch verarbeitet und interpretiert werden kann. Neben der forschungstheoretischen Seite der Computerlinguistik, die die formalen (mathematischen und logischen) Eigenschaften der natürlichen Sprache und ihre Umsetzung in effiziente Algorithmen erforscht, hat die Computerlinguistik auch eine stark anwendungsorientierte Ausrichtung.
Beispiele für bereits existierende und mögliche Anwendungen der Computerlinguistik finden sich in vielen Bereichen unserer modernen Gesellschaft, wie z.B.:
- Unterstützung beim Übersetzen von Texten in eine andere Sprache oder vollständig automatische Übersetzung (Maschinelle Übersetzung).
- Die automatische Aufbereitung und Erschließung großer Datenbasen sprachlich vorliegender Informationen, z.B. durch automatische Erstellung von Zusammenfassungen und Abstracts (Summarization), oder das Auffinden gezielter Informationen in großen Mengen wissenschaftlicher Publikationen (e-Science).
- Das Auffinden von Informationen in heterogenen Datenquellen: z.B. dem Internet, großen strukturierten Datenbanken oder umfangreichen Firmenportalen.
- Die automatische Beantwortung von Fragen auf der Basis großer Datenbanken oder der sprachlichen Informationen im World-Wide Web.
- Schließlich auch Sprachlern- bzw. Korrekturprogramme für Fremdsprachenlerner, wie z. B. Vokabeltrainer und andere Übungsprogramme, sowie auch Korrekturprogramme für Rechtschreibung und Grammatik für Muttersprachler in Texteditoren.
- Sprachliche Interaktion mit Computern oder intelligenten Systemen sogenannter „Künstlicher Intelligenz“ im Bereich von Robotik, virtuellen Welten oder der maschinell unterstützenden medizinischen Versorgung.
Neben ihren praktischen Anwendungen beschäftigt sich die Computerlinguistik mit vielfältigen Forschungsfragen, die sich aus den verschiedenen Aspekten der formalen und algorithmischen Perspektive auf das Phänomen Sprache ergeben:
Die Sprachen der Welt haben viele gemeinsame, aber auch viele unterschiedliche Strukturprinzipien, die die maschinell verarbeitenden Systeme der Computerlinguistik darstellen („repräsentieren“), erkennen und verarbeiten können müssen. Eine Forschungsfrage der Computerlinguistik ist daher, ob bzw. in welchem Maße die Sprachen der Welt auf Basis eines uniformen formalen Grammatikformalismus modelliert und mit computerlinguistischen Algorithmen effizient verarbeitet werden können. Die Frage der kognitiven Adäquatheit solcher Formalismen kann z.B. durch sprachpsychologische Experimente erforscht werden. Die theoretisch orientierte Computerlinguistik widmet sich insbesondere der Frage, welche Aspekte des Sprachsystems durch welche formalen Beschreibungskonstrukte bzw. Algorithmen dargestellt und verarbeitet werden können. Die Computerlinguistik hat als formale Wissenschaft eine stark empirische Seite: durch die Formalisierung und Implementierung der computerlinguistischen Modelle und ihre Anwendung auf sprachliche Daten können ihre Vorhersagen empirisch überprüft und evaluiert werden.
Die Anwendungen der Computerlinguistik sowie ihre Beziehung zu Nachbarwissenschaften sind geprägt durch die Natur und Funktionsweise natürlicher Sprache. Sprache dient vornehmlich der Interaktion und der Kommunikation von Inhalten. Genau wie die menschliche Sprachverwendung ist auch die maschinelle Sprachverarbeitung mit den Barrieren der Vielfalt natürlicher Sprachen konfrontiert. Die Frage, wie die Verarbeitung von Sprache bis hin zur Repräsentation des entsprechenden Wissens zu beschreiben ist, beschäftigt die Computerlinguistik in ihren Berührungspunkten zur Künstlichen Intelligenz, zu den Kognitionswissenschaften und zur Psychologie.
Die Computerlinguistik verbindet die sprachwissenschaftlich motivierte Erforschung des Phänomens Sprache mit exakten Methoden formaler Modellierung und ihrer Umsetzung in algorithmischen und statistischen Verfahren sowie der empirischen Überprüfung ihrer Theorien und Verfahren durch experimentelle Methoden, d.h. durch die Anwendung ausführbarer „Programme“ auf reale Sprachdaten in kontrollierten oder realen Anwendungen.
Voraussetzungen für das Studium
Eine gute Voraussetzung für das Studium der Computerlinguistik ist Interesse sowohl an Sprache wie an Mathematik und Informatik. Notwendig ist eine eher seltene Kombination von geisteswissenschaftlicher Sensibilität und naturwissenschaftlich-mathematischer Begabung. In beiden Bereichen reichen Abiturkenntnisse als Eingangsvoraussetzung aus. Für Personen, die sich für eine dieser beiden Seiten wenig interessieren, eignet sich ein rein philologisches Fach oder Informatik besser.
Das Studium der Computerlinguistik in Heidelberg besteht aus drei Studiengebieten:
- Informatik und Programmierpraxis
- Theoretische und empirische Grundlagen der formalen statistischen Sprachmodellierung
- Algorithmische Computerlinguistik: der Kernbereich der theoretischen und angewandten Computerlinguistik
In allen drei Gebieten müssen Studienleistungen erbracht werden. Informatik und Linguistik liefern die Voraussetzungen, die Algorithmisierung linguistischer Sachverhalte ist der genuine Bereich der Computerlinguistik.
Theorie und Praxis sind in der Computerlinguistik eng aufeinander bezogen, da theoretische Einsichten in lauffähige Programme überführt werden sollen. Deshalb hat die Computerlinguistik teilweise einen ingenieurmäßigen Charakter. Das Besondere an der Computerlinguistik ist die Algorithmisierung der Linguistik. Während man die Benutzung eines Computers lernen kann, während der empirische Linguist schlicht herausfindet, wie die Sprache beschaffen ist, muss der Computerlinguist einen Algorithmus oder ein statistisches Modell entwerfen, um die gewünschten Resultate zu erzielen. Lernen, Forschen und Erfinden bestimmen also das Tätigkeitsfeld des Computerlinguisten. Schließlich ist viel Ausdauer erforderlich. Programmieren braucht viel Zeit. Bis ein Programm fehlerfrei läuft, vergehen oft viele Stunden. Auch führen die empirischen Experimente nicht immer zum gewünschten Ergebnis. Und da die Computerlinguistik eine exakte Wissenschaft ist, gibt es an den Ergebnissen meist nichts zu deuteln, sondern es hilft nur, die Theorie, den Algorithmus oder das Verfahren zu verbessern und neu zu evaluieren.
Inhalte und Aufbau des Studiums
Die Inhalte des interdisziplinären Fachs verteilen sich auf drei Fachbereiche: informatische, linguistische und computerlinguistische Grundlagen. Die Modularisierungsübersichten zu den Bachelor- und Master-Studiengängen Computerlinguistik erläutern die wesentlichen Inhalte. Detaillierte Informationen zu den einzelnen Modulen können auf den Webseiten des Instituts für Computerlinguistik eingesehen werden (www.cl.uni-heidelberg.de).
Die thematischen Schwerpunkte des Fachs sind gegliedert in die folgenden Teilbereiche:
Teilbereiche der Theoretischen Computerlinguistik
- Automatentheorie
- Graphentheorie
- Inferenzverfahren
- Linguistische Repräsentationsformalismen
- Maschinelle Lernverfahren
- Formale Sprachen und Grammatikformalismen
- Methoden statistischer Sprachverarbeitung
- Methoden der algorithmischen Sprachverarbeitung
- weitere verwandte Gebiete
Teilbereiche der Angewandten Computerlinguistik
- Informationsextraktion
- Information Retrieval
- Maschinelle Übersetzung
- Frage-Antwort-Systeme
- Dialogsysteme
- Lernende Systeme
- Natural Language Understanding
- Künstliche Intelligenz u. Wissensrepräsentation
- Phonetik
- Spracherkennung und –synthese
- Spezialthemen der algorithmischen Verarbeitung
- weitere verwandte Gebiete
Teilbereiche der Formalen Linguistik
- Linguistische Grammatiktheorien
- Spezialthemen der formalen Syntax, Semantik, Diskurs- und Dialogsemantik, Pragmatik, Morphologie und Phonologie
- weitere verwandte Gebiete
Teilbereiche der Angewandten Linguistik
- Sprachlernsysteme
- Induktion, Akquisition und formale Repräsentation linguistischer Ressourcen
- Kognitive Linguistik
- Kontrastive Linguistik
- Korpuslinguistik
- weitere verwandte Gebiete
Die Fächer der BA-Studiengänge können grundsätzlich frei miteinander kombiniert werden, sofern ein entsprechendes Studienangebot besteht. Eine detaillierte Auflistung der Bachelor-Studiengänge mit den angebotenen Prozentstrukturen finden Sie hier. Bei Fragen über Fächerkombinationen wenden Sie sich bitte an die Fachstudienberatung.
Die oben angegebenen Sprachkenntnisse müssen erst am Ende des Studiums nachgewiesen werden.
Forschungsumfeld der Computerlinguistik in Heidelberg
Es gibt in Heidelberg drei geisteswissenschaftliche Fakultäten mit verschiedenen interessanten sprachwissenschaftlichen Forschungsschwerpunkten. Die Sprachwissenschaft in Heidelberg ist beispielsweise führend im Bereich der Lexikografie, einem Gebiet, das auch als Anwendungsperspektive für die Computerlinguistik in Frage kommt. Darüber hinaus ist die Computerlinguistik naturgemäß mit der Informatik verknüpft. In Heidelberg existiert einerseits ein (noch junges) Institut für Informatik und andererseits eine „verteilte Informatik“, die sich aus der Einbettung der Informatik in bestimmte Anwendungsfächer, wie z.B. der Computerlinguistik, der Medizinischen Informatik, der Wirtschaftsinformatik oder der Bioinformatik, ergibt. Dieses fakultätsübergreifende Konzept einer anwendungsorientierten Informatik kristallisiert sich besonders am Interdisziplinären Zentrum für Wissenschaftliches Rechnen (IWR), an dem Forscher aus verschiedenen Disziplinen zusammenarbeiten. Das Zentrum verfügt über modernste Rechner, wobei die Parallelverarbeitung im Mittelpunkt steht, und bietet ein breites Lehrangebot für Studierende aller Fächer. Enge Kooperation besteht weiterhin mit dem außeruniversitären Forschungsinstitut für Informationstechnik „Heidelberger Institut für Theoretische Studien" (HITS gGmbH) der Klaus Tschira Stiftung, mit Forschungsabteilungen zu den Bereichen Computerlinguistik, Bioinformatik, u.a.
Formalia
Zulassung
Es besteht keine Zulassungsbeschränkung; Informationen zur Immatrikulation finden Sie hier.
Ausländische Studienbewerber
Für ausländische Studienbewerber gelten besondere Regelungen. Informationen erhalten Sie beim Dezernat Internationale Beziehungen der Universität Heidelberg (Seminarstraße 2).
Fächerkombinationen
Die möglichen Fächerkombinationen ergeben sich aus dem Fächerkatalog.
Studien- und Prüfungsordnungen
Die aktuelle Prüfungsordnung findet man hier.
Modulhandbuch
Das aktuelle Modulhandbuch findet man hier.
Prüfungsausschuss
Zuständig für Anrechnungs-, Anerkennungs- und Prüfungsfragen ist der jeweilige Prüfungsausschuss, bzw. das Prüfungsamt. Nähere Informationen erhalten Sie bei der betreffenden Fachstudienberatung.
Gebühren
Für ein Studium an der Universität Heidelberg fallen zu Beginn jedes Semesters Gebühren an.
Akkreditierung
Die Studiengänge der Universität Heidelberg durchlaufen kontinuierlich das universitätseigene Qualitätsentwicklungsverfahren heiQUALITY und werden in der Regel alle 6 Jahre akkreditiert.
Weitere Informationen zu heiQAULITY in Studium und Lehre finden Sie hier.
Der Studiengang Computerlinguistik hat das universitätseigene Akkreditierungsverfahren erfolgreich durchlaufen.
Masterstudiengang
Die Universität Heidelberg bietet den konsekutiven Masterstudiengang Computerlinguistik an.
Fachstudienberatung
Julius Steen
Raum 123a, INF 325
Tel.: (+49)6221 54-3456
Mi, 13:30-14:30 Uhr, nach Voranmeldung
E-Mail: studienberatung-bachelor@cl.uni-heidelberg.de
Internet: http://www.cl.uni-heidelberg.de/studies/beratung.mhtml
Eva Mujdricza-Maydt
Raum 122, INF 325
Tel.: (+49)6221 54-3483
Do, 11-12 Uhr, nach Voranmeldung
E-Mail: studienberatung-bachelor@cl.uni-heidelberg.de
Internet: http://www.cl.uni-heidelberg.de/studies/beratung.mhtml
Kontakt
Institut für Computerlinguistik
Im Neuenheimer Feld 325
D-69120 Heidelberg
Institutsassistenz
Raum 109a, INF 325
Tel.: +49 (0)6221-54-3245; +49 (0)6221-54-3567
Fax: +49 (0)6221-54-3242
E-Mail icl@cl.uni-heidelberg.de
Internet http://www.cl.uni-heidelberg.de/
Lageplan
Fachschaft
Institut für Computerlinguistik
Im Neuenheimer Feld 325, Raum 204
D-69120 Heidelberg
E-Mail: fs-coli@cl.uni-heidelberg.de
Internet: https://fachschaft.cl.uni-heidelberg.de/