Zeichensatz UTF-8 und ISO-8859-1

Immer dieses Chaos…Geht es euch auch öfter so, dass ihr Daten importieren müßt, wobei die Ausgangsdatei einen anderen Zeichensatz hat als die Zieldatenbank?
Aktuelles Beispiel: ONIX-Datei mit UTF-8 und Zieldatenbank für Buchtitel in ISO-8859-1.
Aufgefallen ist mir das Problem, dass utf8_decode nicht alles behebt, als ich Anführungszeichen als ? (Fragezeichen) sah, die es im ISO-8859-1 einfach nicht gibt. Lösen läßt sich das mit htmlentities. Dabei ist allerdings die Reihenfolge wichtig:
$text = htmlentities($utf8Text, ENT_QUOTES, 'UTF-8', false);
$isoText = utf8_decode($text);

  • Share/Bookmark

Das könnte Sie auch interessieren:

This entry was posted in Entwicklung and tagged . Bookmark the permalink.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="">