Höhere Programmiersprache
Eine höhere Programmiersprache ist eine Programmiersprache zur Abfassung eines Computerprogramms, die in Abstraktion und Komplexität von der Ebene der Maschinensprachen deutlich entfernt ist. Die Grenze zwischen einfachen und höheren Programmiersprachen ist nicht eindeutig definiert. Mindestmerkmal ist, dass die Befehle höherer Programmiersprachen nicht unmittelbar von Mikroprozessoren verstanden und ausgeführt werden können. Die Befehle müssen durch Interpreter oder Compiler in Maschinensprache übersetzt werden. Oft sind noch weitere Stufen wie umfangreiche Betriebssysteme dazwischengeschaltet.
Die Bezeichnung als „höhere“ Sprache bezieht sich in der Informatik nicht auf den Schwierigkeitsgrad, darin zu programmieren. Im Gegenteil sollen es höhere Programmiersprachen erleichtern, komplexe Aufgaben mit einem Computerprogramm zu operationalisieren. Vielmehr bezieht sich das Attribut „höher“ auf die Abstraktionsebene der Programmiersprache. Vereinfacht kann man sagen, dass höhere Programmiersprachen mehr und komplexere logische Zusammenhänge kürzer ausdrücken, der dann durch automatisierte Prozesse auf Maschinencode heruntergebrochen wird. Die Lesbarkeit des Programmtextes wird so erhöht und die Anzahl der expliziten rekursiven Aufgaben verringert.
Geschichte
Die ersten Computer wurden mit Hilfe von Programmen in Maschinencode programmiert. Dieser besteht lediglich aus einer Folge von Zahlen, die vom Prozessor als Befehlsfolge interpretiert werden. Diese Befehle bestehen aus einfachen Anweisungen wie Arithmetik, Speicherzugriffen usw. Die erste Innovation war die Erfindung von Assemblersprachen, die nicht abstrahieren, die Befehle aber in Textform darstellen.
Als weltweit erste höhere Programmiersprache kann Plankalkül von Konrad Zuse angesehen werden, das allerdings nicht praktisch angewandt wurde. Erst Ende der 1950er Jahre wurden Computer so leistungsfähig, dass Übersetzungsprogramme die Eingabe von Programmen wesentlich erleichtern konnten. Fortran, ALGOL und Lisp waren die ersten Vertreter, deren Namen noch an die neuen, komfortableren Möglichkeiten der Sprachen und Übersetzerprogramme erinnern:
- Fortran – FORmula TRANslation = Formelübersetzung
- ALGOL – ALGOrithmic Language = Algorithmensprache
- LISP – LISt Processing = Listenverarbeitung
Diese ersten höheren Sprachen enthielten abstrakte Elemente wie bedingte Anweisungen („wenn x wahr, dann führe y aus“) und Schleifen („solange x gilt, führe y aus“). Diese Konstrukte konnten nun mit weniger Aufwand programmiert werden und drückten in lesbarer Form ihren Zweck aus.
Später folgten weitere Sprachen, die ein höheres Maß an Abstraktion boten. Ein Programm konnte in Unterprogramme (Prozeduren) eingeteilt und diese wiederum zu Modulen zusammengefasst werden. So war es möglich, Teilprogramme von verschiedenen Programmierern entwickeln zu lassen, ohne dass eine Konvention über die verwendeten Variablen getroffen werden musste, da für jede Prozedur die Variablen neu definiert wurden. Wohl aber wurden Ein- und Ausgangsparameter vom Haupt- ans Unterprogramm übergeben und umgekehrt.
Die ersten höheren Sprachen wurden direkt in Assemblersprachen oder Maschinencode übersetzt, um ausgeführt werden zu können. Einige modernere Sprachen werden heute zunächst in weniger hohe Sprachen übersetzt, aus denen wiederum ein effizienter Maschinencode gewonnen werden kann. Die Programme, mit denen solche Übersetzungen ausgeführt werden, heißen Compiler. Da die Abstraktionen mittlerweile weit vorangeschritten sind, ist der Begriff „höhere Sprache“ relativ zu sehen. So sind die ersten Sprachen wie Fortran höhere Sprachen als Assembler und modernere Sprachen höher als Fortran.
Daneben kann ein Programm in einer höheren Programmiersprache auch interpretiert werden. Dabei wird das Programm nicht vorab in Maschinencode übersetzt, sondern während seiner Laufzeit führt ein Interpreter die Anweisungen aus. Dieser bildet also eine Schnittstelle zwischen Rechner und Programm und ist heutzutage meist in einer anderen höheren Programmiersprache geschrieben.
Die meisten „modernen“ Programmiersprachen (BASIC, C, C++, C#, VB.NET, Pascal und Java) sind Sprachen der dritten Generation.
Vergleich zur Assemblersprache
Assemblersprache | Höhere Programmiersprache |
---|---|
Stark komprimierte, platzsparende Syntax | Syntax an menschliche Gewohnheiten angepasst |
Nur auf einem bestimmten Prozessortyp lauffähig | Großteils prozessorunabhängig |
Hohe Geschwindigkeit durch maschinennahe Befehle | Geschwindigkeitsverlust durch Übersetzung in Maschinensprache |
Datentypen des Prozessors (Byte, Wort, Langwort) | Abstrakte, maschinenunabhängige Datentypen (Gleitkommazahlen u. a.) |
Nur einfache Datentypen | Datenstrukturen (Feld, Record) |
Sprungbefehle, Makros | Mehrere Kontrollstrukturen (if, while, …) |
Grundlegende semantische Analyse möglich | Weitgehende semantische Analyse möglich |
Beispiel: .START ST ST: MOV R1,#2 MOV R2,#1 M1: CMP R2,#20 BGT M2 MUL R1,R2 INI R2 JMP M1 M2: JSR PRINT .END |
Beispiel: A:=2; FOR I:=1 TO 20 LOOP A:=A*I; END LOOP; PRINT(A); |
Einordnung und Nachfolge
Die höheren Programmiersprachen nennt man auch Programmiersprachen der dritten Generation (englisch third generation languages, kurz 3GL). In Programmiersprachen der dritten Generation muss genau beschrieben werden, wie ein bestimmtes Problem gelöst werden soll. Die Aufgabenstellung ist schwierig aus dem Quellcode zu erkennen. Darum wurden Programmiersprachen der vierten Generation entwickelt, die normalerweise für spezielle Problemlösungen optimiert sind und bei denen der Code beschreibt, was der Computer ausführen soll.
Heute gibt es zahlreiche unterschiedliche höhere Programmiersprachen, von denen einige allgemein anwendbar sind, andere aber nur für Spezialanwendungen eingesetzt werden. Allgemein anwendbare Programmiersprachen (general purpose languages) sind nicht auf spezielle Anwendungsfälle zugeschnitten und bieten allgemeine Abstraktionen. Die sog. domänenspezifischen Sprachen (Domain Specific Languages, DSL) andererseits ermöglichen Abstraktionen für einen bestimmten Anwendungsfall. Letztere werden derzeit intensiv erforscht. So gibt es Sprachen für die Gleissteuerung von Zugstrecken mit teilweise grafischer Programmierung, d. h. der „Programmtext“ besteht dort aus Grafiken, die beispielsweise per Mauseingabe manipuliert werden können. Das Ziel bei dieser Programmierweise ist es, eine Abfassung von Programmen in Textform unnötig zu machen und die Programmierung durch intuitive Bedienung einer größeren Anwendergruppe zugänglich zu machen.
Beispiele
Einige Beispiele für aktuelle höhere Programmiersprachen sind im Folgenden gelistet. Neben dem Namen ist angegeben, ob es sich um eine interpretierte Sprache handelt, oder ob eine Übersetzung in Maschinencode durch einen Compiler erfolgt. Bei interpretierten Sprachen ist ein entsprechendes Programm (Interpreter) zur Laufzeit erforderlich, um den Quellcode zu interpretieren und auszuführen.
- Java – in Bytecode kompiliert; durch Java Virtual Machine interpretiert oder weiter in Maschinencode kompiliert
- C++ – kompiliert
- JavaScript – interpretiert
- C# – in Common Intermediate Language kompiliert; durch Virtual Execution System interpretiert[1]
- Python – interpretiert
- PHP – interpretiert
- Ruby – interpretiert