Zusammenfassung
Hate Speech ist eine Erscheinung, die sowohl online als auch offline auftreten kann. Vor allem im Internet, zum Beispiel auf Social-Media-Plattformen, in Messenger-Diensten und in Kommentaren auf unzähligen Webseiten, verbreitet sich Hate Speech rasant und wird damit zu einem immer schwerer in den Griff zu bekommenden Problem. Um der steigenden Flut von Hate Speech entgegenzuwirken, sind daher automatisierte Lösungen, die beispielsweise als Vorfilter eingesetzt werden können, unabdingbar. Dieser Beitrag befasst sich mit der automatisierten Erkennung von Hate Speech aus der Perspektive des Maschinellen Lernens und beschreibt die Herausforderungen, die damit auf verschiedenen Ebenen einhergehen. Diesen werden mögliche Ansätze zur Lösung des Problems gegenübergestellt. Die diskutierten Ansätze wurden im Rahmen des BMBF-geförderten Projekt KISTRA 1 eingesetzt.
Literatur
Politisch motivierte Kriminalität (PMK) -rechts-. Hasspostings/Hate Speech im Internet. BKA-Webseite: https://www.bka.de/DE/UnsereAufgaben/Deliktsbereiche/PMK/PMKrechts/PMKrechts_node.html (Abgerufen am: 17.01.2023).
Projektumriss KISTRA (Einsatz von KI zur Früherkennung von Straftaten). SIFO-Webseite: https://www.sifo.de/sifo/shareddocs/Downloads/files/projektumriss_kistra.pdf?__blob=publicationFile&v=1 (Abgerufen am: 17.01.2023).
Thinh Truong, Timothy Baldwin, Trevor Cohn, and Karin Verspoor. 2022. Improving Negation Detection with Negation-Focused Pre-training. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 4188–4193, Seattle, United States. Association for Computational Linguistics.
Li, J., Li, D., Xiong, C., & Hoi, S. (2022). BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation. ICML.
Alayrac, J., Donahue, J., Luc, P., Miech, A., Barr, I., Hasson, Y., Lenc, K., Mensch, A., Millican, K., Reynolds, M., Ring, R., Rutherford, E., Cabi, S., Han, T., Gong, Z., Samangooei, S., Monteiro, M., Menick, J., Borgeaud, S., Brock, A., Nematzadeh, A., Sharifzadeh, S., Binkowski, M., Barreira, R., Vinyals, O., Zisserman, A., & Simonyan, K. (2022). Flamingo: a Visual Language Model for Few-Shot Learning. ArXiv, abs/2204.14198.
Reimers, N., & Gurevych, I. (11 2019). Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing.
Wolf, T., Debut, L., Sanh, V., Chaumond, J., Delangue, C., Moi, A., Cistac, P., Ma, C., Jernite, Y., Plu, J., Xu, C., Le Scao, T., Gugger, S., Drame, M., Lhoest, Q., & Rush, A. M. (2020). Transformers: State-of-the-Art Natural Language Processing [Conference paper]. 38–45.
Garbe, W. WordSegmentationTM. Github-Webseite: https://github.com/wolfgarbe/WordSegmentationTM (Abgerufen am: 24.01.2023).
Lucian Vlad Lita, Abe Ittycheriah, Salim Roukos, and Nanda Kambhatla. 2003. In Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics, pages 152–159, Sapporo, Japan. Association for Computational Linguistics.
Open AI. ChatGPT-Webseite: https://openai.com/blog/chatgpt (Abgerufen am: 25.01.2023).
Google Developers. Machine Learning Glossary. Webseite: https://developers.google.com/machine-learning/glossary (Abgerufen am: 01.02.2023).
Open AI. CLIP-Webseite: https://openai.com/blog/clip (Abgerufen am: 20.01.2023).
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Halvani, O. Möglichkeiten zur Erkennung von Hate Speech. Datenschutz Datensich 47, 209–214 (2023). https://doi.org/10.1007/s11623-023-1747-3
Published:
Issue Date:
DOI: https://doi.org/10.1007/s11623-023-1747-3