SoX
SoX (von engl. Sound eXchange) ist eine freie, plattformübergreifende Software zur Audiobearbeitung. Die Bedienung erfolgt über die Kommandozeile. Als grafische Benutzeroberflächen existieren die X-Oberfläche xsox sowie die Gnome-Oberfläche gsox.[1] Das in C geschriebene Programm wird über das Softwareportal SourceForge vertrieben.
SoX | |
---|---|
Basisdaten | |
Entwickler | Chris Bagwell u. a. |
Erscheinungsjahr | 1991 |
Aktuelle Version | 14.4.2 |
Betriebssystem | Windows, Linux, macOS |
Programmiersprache | C |
Kategorie | Audioeditor |
Lizenz | GNU GPLv2, GNU LGPL v2 |
deutschsprachig | nein |
sox.sourceforge.net |
Eigenschaften
Einige Features von SoX sind beispielsweise:[2][3]
- Unterstützung eines breiten Spektrums an Audio- bzw. Video-Audio-Formaten (u. a. Raw, AIFF, AU, CDDA, MP2/MP3, MP4, AAC, AC3, AVI, WMV, Ogg Vorbis, FLAC, .WAV);
- verschiedene Editier- und Abmischfunktionen wie z. B. konsekutives oder auch synchrones Zusammenführen mehrerer Dateien zu einer einzigen (Letzteres etwa bei der Herstellung einer Stereoaufnahme aus zwei Monoaufnahmen), Abmischung mehrerer Dateien, Fade, Normalisierung, Kompressor, Expander, Limiter; Editieren mittels einer Spracherkennungsfunktion;
- Implementation von Filtern (u. a. Allpass, Bandpass, Bandsperre, Equalizer, FIR-Filter);
- Implementation von Soundeffekten wie z. B. Chorus, Flanger, Phaser, Delay, Echo, Tremolo, Reverb, Pitch, Time-Stretching, Umkehrung von Tondaten;
- spezielle Funktionen wie Geräuschreduktion, Änderung der Samplerate, Out of Phase Stereo, einfache Audiosynthese, statistische Analyse bzw. Analyse mittels eines Spektrogramms.
Einbindung in Skripte
Aufgrund seiner Bedienung über die Kommandozeile ermöglicht es SoX, seine Funktionen in Skripte einzubinden. So ist es beispielsweise möglich, theoretisch unbegrenzt viele Dateien gleichzeitig zu bearbeiten oder auch das Programm mit anderer Software zu kombinieren (z. B. mittels Pipelines).
Anwendung der Software in Wissenschaft und Lehre
Der große Funktionsumfang des Programms bzw. die Möglichkeit, es in Skripte einzubinden, erlauben es z. B., dass die Software als frei konfigurierbares und somit flexibles Werkzeug über den Bereich der Musikproduktion hinaus in Wissenschaft und Lehre gezielt zur Anwendung kommen kann. So wurde SoX in seiner Entwicklungsgeschichte u. a. im Rahmen wissenschaftlicher Studien eingesetzt[4][5][6][7][8][9] bzw. war mehrfach Bestandteil von Kursunterlagen und Lernmaterialien an internationalen Hochschulen[10][11][12][13][14].
pysox: ein Wrapper für SoX in Python
Der Umstand, dass längere Eingaben über die Kommandozeile u. U. unübersichtlich und gegebenenfalls fehleranfällig werden können, war Anlass für die Entwicklung von pysox, eines Wrappers für SoX in Python. Das Programm enthält bereits die Kernfunktionen von SoX. Die Weiterentwicklung der Software, so die Autorin bei der Präsentation auf der internationalen Fachkonferenz International Society for Music Information Retrieval Conference (ISMIR) im Jahre 2016, wird jedoch angestrebt, um den Funktionsumfang des Wrappers noch zu vergrößern.[15]
Sicherheit
SoX weist seit seinem letzten Update im Jahre 2015 (Stand: August 2019) verschiedene Sicherheitslücken auf, zu denen Pufferüberläufe oder die Angreifbarkeit gegenüber Denial-of-Service-Attacken gehören.[16] Für die Linuxsysteme Debian und Ubuntu stehen Sicherheitsupdates bereit.[17]
Siehe auch
- Audacity (Audioeditor mit grafischer Benutzeroberfläche, der einige Funktionen von SoX enthält)
Weblinks
Einzelnachweise
- Michael Kofler: Linux 2011. Addison-Wesley Verlag, 2011, ISBN 978-3-8273-3025-3, S. 372.
- Chris Bagwell: SoX Sound Exchange Library. In: Ken Greenebaum, Ronen Barzel (Hrsg.): Audio Anecdotes II: Tools, Tips, and Techniques for Digital Audio. A K Peters/CRC Press, 2004, ISBN 1-5688-1214-0, S. 227–237?.
- Übersicht aller Features auf der Homepage
- Maxime Lardeur, Slim Essid, Gaël Richard, Martin Haller, Thomas Sikora: Incorporating prior knowledge on the digital media creation process into audio classifiers. In: Proceedings of ICASSP 2009, IEEE International Conference on Acoustics, Speech, and Signal Processing. Taipeh April 2009, ISBN 978-1-4244-2353-8, S. 1653–1656 (PDF frei abrufbar: http://elvera.nue.tu-berlin.de/files/1193Lardeur2009.pdf; 238,4 kB).
- Robert Buchholz, Christian Kraetzer, Jana Dittmann: Microphone Classification Using Fourier Coefficients. In: Stefan Katzenbeisser, Ahmad-Reza Sadeghi (Hrsg.): Information Hiding. 11th International Workshop, IH 2009, Darmstadt, Germany, June 8-10, 2009, Revised Selected Papers. Springer-Verlag, Berlin/Heidelberg 2009, ISBN 978-3-642-04430-4, S. 235–246 (PDF frei abrufbar: https://www.researchgate.net/profile/Robert_Buchholz/publication/220722263_Microphone_Classification_Using_Fourier_Coefficients/links/02e7e51ab25f0170ac000000/Microphone-Classification-Using-Fourier-Coefficients.pdf; 168,8 kB).
- Benjamin Bock, Lior Shamir: Assessing the efficacy of benchmarks for automatic speech accent recognition. In: ICST (Institute for Computer Sciences, Social-Informatics and Telecommunications Engineering) (Hrsg.): Proceedings of the 8th International Conference on Mobile Multimedia Communications. Brussels 2015, ISBN 978-1-63190-066-2, S. 133–136 (PDF frei abrufbar: https://www.researchgate.net/profile/Lior_Shamir/publication/281069316_Assessing_the_efficacy_of_benchmarks_for_automatic_speech_accent_recognition/links/55da473108ae9d659491edc0/Assessing-the-efficacy-of-benchmarks-for-automatic-speech-accent-recognition.pdf; 178,4 kB).
- Gangeshwar Krishnamurthy, Navonil Majumder, Soujanya Poria, Erik Cambria: A Deep Learning Approach for Multimodal Deception Detection. 2018, arXiv:1803.00344 [cs.CL] (PDF frei abrufbar: https://arxiv.org/pdf/1803.00344.pdf; 460,8 kB).
- Earl T. Barr, Mark Harman, Yue Jia, Alexandru Marginean, Justyna Petke: Automated Software Transplantation. In: Proceedings of the 2015 International Symposium on Software Testing and Analysis. ACM, New York 2015, ISBN 978-1-4503-3620-8, S. 257–269 (PDF frei abrufbar: http://earlbarr.com/publications/autotransplant.pdf; 657 kB).
- Vasileios Bountourakis, Lazaros Vrysis, Konstantinos Konstantoudakis, Nikolaos Vryzas: An Enhanced Temporal Feature Integration Method for Environmental Sound Recognition. In: MDPI (Hrsg.): Acoustics. Nr. 1, Basel 2019, ISSN 2624-599X, S. 410–422 (PDF frei abrufbar: https://res.mdpi.com/d_attachment/acoustics/acoustics-01-00023/article_deploy/acoustics-01-00023.pdf; 565,9 kB).
- Ludwig-Maximilians-Universität München: SoX in den Kursunterlagen eines Bachelor-Moduls im Sommersemester 2010. Abgerufen am 7. September 2019.
- Technische Universität Chemnitz: SoX in den Kursunterlagen Abgerufen am 7. September 2019.
- Universität Mozarteum Salzburg, SoX im Studio für Elektronische Musik Abgerufen am 7. September 2019.
- University of California, Berkeley, UC Berkeley Phonology Lab: „Sox in phonetic research“ Abgerufen am 11. September 2019.
- University of Pennsylvania, SoX als Lernmaterial im Phonetics Laboratory des Department of Linguistics Abgerufen am 7. September 2019.
- Rachel M. Bittner, Eric Humphrey, Juan P. Bello: pysox: Leveraging the audio signal processing power of SoX in Python. In: Extended abstracts for the Late-Breaking Demo Session of the 17th International Society for Music Information Retrieval Conference 2016. Frei verfügbar unter Creative Commons Attribution 4.0 International License (CC BY 4.0), 2016 (PDF: https://pdfs.semanticscholar.org/1bd0/e8dd42aa4af26b4fd7f0cf44e23239208420.pdf; 130,7 kB).
- Übersicht der bis dato (August 2019) bekannten Sicherheitslücken in der National Vulnerability Database
- Auflistung der Sicherheitsupdates für Debian bzw. Ubuntu