
RTSP arbeitet mit einem Anfrage-Antwort-Modell für die Kommunikation zwischen Clients und Servern. Mit diesem Protokoll können Clients Befehle an den Server senden und ihn anweisen, verschiedene Aktionen auszuführen, z. B. eine Sitzung zu starten, die Wiedergabe zu pausieren oder einen bestimmten Zeitstempel zu suchen. Durch diesen Ansatz ermöglicht RTSP eine nahtlose Kontrolle über Streaming-Sitzungen. RTSP wird in einer Reihe von Szenarien eingesetzt, z. B. bei CCTV-Überwachungskameras, wo es das Live-Streaming und die Fernüberwachung ermöglicht.
Um eine Streaming-Sitzung aufzubauen, sendet der Client eine RTSP-DESCRIBE-Anfrage an den Server. Der Server antwortet daraufhin mit Informationen über die verfügbaren Medienströme, wie Codecs, Bitraten und URLs. Der Client sendet dann eine SETUP-Anforderung, um die Transportparameter für den gewünschten Medienstrom anzugeben. Sobald die Sitzung eingerichtet ist, kann der Client die Befehle PLAY, PAUSE und TEARDOWN erteilen, um die Wiedergabe zu steuern.
Um diesen Vorgang etwas zu verdeutlichen, werden hier einige der üblichen Verfahren dieses Protokolls beschrieben:
1.Der Client stellt eine TCP-Verbindung mit dem Server her und verwendet dabei den Standard-Port für RTSP, nämlich 554.
2.Der Client sendet eine RTSP-Anfrage an den Server, in der er den gewünschten Vorgang (z. B. Wiedergabe, Pause, Aufnahme) und die URL des Medienstroms angibt.
3.Der Server antwortet auf die Anfrage des Clients und gibt die Verfügbarkeit und die Einzelheiten des angeforderten Streams an.
4.Wenn der Stream verfügbar ist und der Client über die erforderlichen Ressourcen verfügt, wird eine Mediensitzung aufgebaut.
5.Der Server beginnt mit dem Streaming der Multimedia-Inhalte an den Client über einen separaten Datenkanal, in der Regel über RTP.
6.Der Client empfängt die Mediendaten und rendert sie für die Wiedergabe.
Dies alles geschieht jedoch in wenigen Augenblicken, so dass der Client nicht einmal merkt, dass all dies im Hintergrund geschieht.