HTML-Bleacher für geschützten Code

Bleach
Kommentare

Bleach ist ein Whitelist-basierter HTML-Sanitizer. Ein was? Nun, man kennt das ja: Bakterien und Verfärbungen machen die Zähne gelbstichig und angreifbar. Die Industrie hat das längst aufgegriffen durch

Bleach ist ein Whitelist-basierter HTML-Sanitizer. Ein was? Nun, man kennt das ja: Bakterien und Verfärbungen machen die Zähne gelbstichig und angreifbar. Die Industrie hat das längst aufgegriffen durch ein Überangebot an Zahncremes mit „Whitening-Effekt“ und Schutzmittel, so dass dem Schmutz zu Leibe gerückt und das Gebiss geschützt wird. Warum dieser Ausflug in die Zahnkosmetik? – Weil der Entwickler James Socol mit Bleach im Grunde genau das Gleiche macht.

Bleach ist eine Library mit der euer HTML-Code eine Tiefenreinigung erfahren soll. Basierend auf einer Whitelist werden Markup und Attribute belassen bzw. entfernt, außerdem besteht die Möglichkeit der Text Linkification. Somit soll Bleach dabei helfen den Text von nicht-vertrauenswürdigen Sourcen zu befreien. Bleach nutzt html5lib um Dokumentfragmente zu parsen und soll dadurch deutlich robuster gegen unbekannte Attacken sein, als vergleichbare Regular-Expression-basierte Sanitizer. Die linkify-Funktion kann konfiguriert werden und sich zum Finden, Editieren und Filtern von Links nutzen lassen.

Ihr könnt Bleach auf GitHub herunterladen.

Aufmacherbild: Boxing for protect von Shutterstock / Urheberrecht:Kninwong

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -