WBCE CMS Forum

WBCE CMS – Way Better Content Editing.

You are not logged in.

#1 07.08.2019 19:34:48

hamburgerhans
Banned

[Erledigt] HTML Entities statt utf-8?

Den usbWebserver wollte ich für einen Test (Michaels Wörterbuch) nutzen.
Leider zeigt der Editor im Quellcode, und damit im Endergebnis, ein etwas "unschönes" Verhalten.
Zum Beispiel HTML Entities statt utf-8, oder Tags, die mit <p></p> eingeschlossen werden.

Da ich diesen Editor natürlich auch in anderen CMS gesehen und mit ihm geschrieben habe, bin ich über dieses Verhalten mehr als erstaunt.

Es scheint aber, daß bis dato niemand daran Anstoß genommen hat.
Weiß wer mehr?
Gruß, HH.

Last edited by hamburgerhans (07.08.2019 19:36:09)

Offline

#2 07.08.2019 19:58:09

colinax
Administrator

Re: [Erledigt] HTML Entities statt utf-8?

In der Quellcode Ansicht des CKE sind die HTML Entities normal, da diese Sonderzeichen ja auch gespeichert werden müssen, im Frontend Quellcode sieht man das normale Sonderzeichen.

Das Ganze wird im Core selbst, vice versa übersetzt.

Falls du mit Tags z.B. img Tags meinst, dass ist auch normal, und durch die CKE Entwickler vorgegeben, jeder (neue) Absatz muss mit <p></p> anfangen und enden.

Offline

#3 07.08.2019 20:19:11

hamburgerhans
Banned

Re: [Erledigt] HTML Entities statt utf-8?

colinax wrote:

im Frontend Quellcode sieht man das normale Sonderzeichen

Genau das ist hier nicht zu sehen. Der Aufruf der ersten Seite genügt, um das Ergebnis der Zeile "Hinweis: Wenn Du vorhast, mit WBCEPortable eine Seite zunächst lokal zu erstellen, um sie später auf ..." im Frontend/Browser zu sehen.

html-Elemente wie z.B. iFrame oder object werden nicht in Elementen zur Textstrukturierung eingebettet.
Wie schon gesagt, dieses Verhalten kenne ich so beim CKEdit nicht.

Ein kleiner Nachtrag: Vielleicht findet sich jemand, der es sich auf dem usbWebserver anschaut, und etwas über das Verhalten sagt.
Gruß, HH.

Last edited by hamburgerhans (07.08.2019 20:50:05)

Offline

#4 07.08.2019 21:08:20

bernd
Developer

Re: [Erledigt] HTML Entities statt utf-8?

dieses Verhalten kenne ich so beim CKEdit nicht.

Da wäre vielleicht noch interessant zu wissen auf welche Version des CKE du dich beziehst (es gibt ja nicht den CKEditor) und in welchem Umfeld das ist - könnte ja sein das in einem bestimmten Umfeld jemand spezielle Konfigurations-Anpassungen vorgenommen hat?!?


... nein in Europa verwenden wir beim Programmieren nicht € statt $ ...

Online

#5 07.08.2019 21:53:22

bernd
Developer

Re: [Erledigt] HTML Entities statt utf-8?

Vielleicht findet sich jemand, der es sich auf dem usbWebserver anschaut, und etwas über das Verhalten sagt.

Du meinst das?
screenshot.png

Ist im Quelltext mit HTML-Entities dargestellt.

Last edited by bernd (07.08.2019 21:56:41)


... nein in Europa verwenden wir beim Programmieren nicht € statt $ ...

Online

#6 07.08.2019 21:55:30

hamburgerhans
Banned

Re: [Erledigt] HTML Entities statt utf-8?

Es ist der portable usbWebserver, der aus "/wbce.org/de/downloads/"
Am Paket ist nichts geändert worden. Es ist anscheinend "nur" der Editor, welcher sich wie beschrieben verhält.
WBCE selbst macht es richtig. 

Die Eingabe von
    <div><p>
  ÜÄÖßüäö
  </div></p>
 
im Editor bringt als Ergebnis (Browser)
  <div>
<p>&Uuml;&Auml;&Ouml;&szlig;&uuml;&auml;&ouml;</p>
</div>

code2 html bringt als Ergebnis (Browser)
<div><p>
  ÜÄÖßüäö
  </div></p>   

Das portable Paket einfach mal starten und gegebenenfalls aufzuklären liegt eigentlich näher, statt erstmal alles infrage zu stellen. Ist aber trotzdem nachvollziehbar - man möchte sich ja auch nicht bei jeder Frage "den Wolf suchen" angel

Ja, ich meine "das". Aber ich habe das Verhalten jetzt mehrmals mit neuen und Unterseiten überprüft. Komme aber immer zum gleichen Ergebnis.
Gruß, HH.

Last edited by hamburgerhans (07.08.2019 22:00:31)

Offline

#7 07.08.2019 22:00:40

bernd
Developer

Re: [Erledigt] HTML Entities statt utf-8?

Lieber Hans,
1. habe ich einfachmal gestartet und ausprobiert (#5)
2. habe ich nichts "in Frage gestellt" sondern wollte lediglich wissen auf welche CKE-Version in welchem Umfeld du dich beziehst wenn du schreibst "dieses Verhalten kenne ich so beim CKEdit nicht."


... nein in Europa verwenden wir beim Programmieren nicht € statt $ ...

Online

#8 07.08.2019 22:05:12

hamburgerhans
Banned

Re: [Erledigt] HTML Entities statt utf-8?

HH wrote:

Ist aber trotzdem nachvollziehbar - man möchte sich ja auch nicht bei jeder Frage "den Wolf suchen"

Hatte ich noch korrigiert, um Mißverständnisse auszuräumen.

Nun weiß ich aber immer noch nichts genaues.
Du siehst  dieses Verhalten beim portablen nicht?
Wäre merkwürdig, habe die aktuelle Version (7.2019)

Gruß, HH.

Nachtrag. Ich werde langsam müde, war heute mehrmals am Limit beim Job. Nun sehe ich:

Bernd wrote:

Ist im Quelltext mit HTML-Entities dargestellt.

Im Browser - ohne im CMS angemwldet zu sein - sehe ich auch kein unicode (utf-8), also Umlautz...

Aber es nicht nur das, entdecke noch anderes. Muß mal schauen, wo es dafür eine Lösung gibt.

Ja, und nicht zu vergessen: Dank dafür, daß Du Dir die Mühe gemacht hast thumb_up

Ich muß jetzt rein um morgens wieder rauszukommen. Gute Nacht.

Last edited by hamburgerhans (07.08.2019 22:15:50)

Offline

#9 07.08.2019 22:21:31

bernd
Developer

Re: [Erledigt] HTML Entities statt utf-8?

Da ich es leid bin mich mit dem Portable auf Win10 rumzuquälen habe ich das ganze wie von dir in #6 beschrieben auch nochmal auf meiner lokalen Spielwiese ausprobiert.
Ja! es ist so wie von dir aufgeführt
Im CKE eingegeben Umlaute werden als HTML-Entities in der DB gespeichert und auch so im Browser-Quelltext dargestellt.
Mit Code2 im HTML-Modus eingegebene Umlaute werden "im Klartext" gespeichert und auch so im Browser-Quelltext dargestellt.

So what (kann sein das ich mal wieder begriffsstutzig bin) - wo ist das Problem, die Darstellung im Browser ist in beiden Fällen korrekt.


... nein in Europa verwenden wir beim Programmieren nicht € statt $ ...

Online

#10 07.08.2019 22:46:22

hamburgerhans
Banned

Re: [Erledigt] HTML Entities statt utf-8?

So, einer geht noch

Bernd wrote:

kann sein das ich mal wieder begriffsstutzig bin

Oh man, es gibt andere, die können das noch viiiiel besser, statt nur so einen kleinen Einbruch ::mittelfingeraufmichzeigt::

Die Antwort fällt knapp aus, im Content sollte man Unicode nutzen können, daher gehören HTML-Entities da nicht hin. Wenn dann noch die erweiterten Zeichen im Fontsatz (utf8mb4) nutzen möchte wird das unmöglich.

Scheinheilig gefragt, wozu utf-8 in den Templates, und  in der Content-Verarbeitung (code2 macht es sichtbar), aber beim Editor nicht?
Gruß, HH.
ps. Und entschuldige meine Ungeduld ein paar Abschnitte zuvor. Manchmal - nein,  wem auch immer sei Dank , eher selten - merke ich leider erst auf dem zweiten Blick, daß es längst Zeit ist etwas zu beenden.

Last edited by hamburgerhans (07.08.2019 22:53:46)

Offline

#11 07.08.2019 23:13:06

bernd
Developer

Re: [Erledigt] HTML Entities statt utf-8?

Es gibt diesbezüglich entsprechende Konfigurations-Optionen für den CKE, z.B. "config.entities = false"
Warum da der default "true" ist ?!? Ich lehne mich mal weit aus dem Fenster: historisch gewachsen und man geht erstmal auf Nummer sicher wenn man nicht weiss in welcher möglicherweise verquer konfigurierten Datenbank das gespeichert werden soll.

Lesefutter zu den Entity-Konfigurations-Möglichkeiten des CKE4:
https://ckeditor.com/docs/ckeditor4/lat … figuration


... nein in Europa verwenden wir beim Programmieren nicht € statt $ ...

Online

Liked by:

florian

#12 08.08.2019 07:52:55

florian
Administrator

Re: [Erledigt] HTML Entities statt utf-8?

Das bestehende Verhalten des ckeditors ist seit Jahren bewährt und kein Fehler.
Gerade beim Export/Import von Datenbankdaten (Rückspielen von Sicherungen, Übertragen von Webseiten) ist es ein Segen, dass Sonderzeichen als HTML-Entities gespeichert werden. Hingegen kommt es oft genug zu Problemen, wenn in Feldinhalten Umlaute nicht-codiert gespeichert sind.

Eine Notwendigkeit zur Änderung des standardmäßig konfigurierten Verhaltens des CKEditors sehe ich aktuell nicht.

Natürlich steht es jedem frei, für seine ganz spezifischen Bedürfnisse die Konfiguration des CKE in seiner eigenen Installation anzupassen.

Offline

Liked by:

mrbaseman

#13 08.08.2019 08:09:41

berny
Member

Re: [Erledigt] HTML Entities statt utf-8?

ich verstehe die Aufregung nicht.

1) html entities ist langjähriger Standard und w3c konform, schon bevor utf8 ein Thema wurde.

2) im Code MUSS der Inhalt in Reinschrift übersetzt werden, sonst würde eventuell der Code falsch übersetzt werden.
Hier stellt sich die Frage, warum jemand im Code zb ein Ü und kein &Uuml; reinschreibt.

Für mich war das bisher eine logische Vorgangsweise, bin aber mit meinem Wissen in diese Richtung vielleicht auch schon etwas veraltet

Last edited by berny (08.08.2019 08:10:45)

Online

#14 08.08.2019 08:43:24

kleo
Member

Re: [Erledigt] HTML Entities statt utf-8?

Es ist eigentlich ein anderes Thema, was ich jetzt hier erwähne, aber vom Sinn der Sache ist es sehr ähnlich.

Die Language-Dateien bei der WBCE sind auch mit  HTML Entities statt utf-8 erstellt. Macht es irgeneinen Sinn?

Es ist aber nicht einfach oft nötige Korrekturen bei diesen Dateien vorzunehmen...

Last edited by kleo (08.08.2019 08:43:58)

Offline

#15 08.08.2019 08:51:32

florian
Administrator

Re: [Erledigt] HTML Entities statt utf-8?

@kleo: Ich vermute, das hängt/hing damit zusammen, dass die Dateien früher ANSI- und nicht UTF-8-codiert gespeichert gewesen sind, und sobald da ein Sonderzeichen oder Umlaut drin stand, diese nicht mehr im AFE angezeigt worden sind, und es unabhängig davon zu Problemen kommt, wenn bei den Grundeinstellungen ein anderer Zeichensatz als UTF-8 eingestellt ist (ISO-8859-1 o.ä.).
Wie gesagt, ist aber nur eine Vermutung.

Last edited by florian (08.08.2019 08:52:10)

Offline

#16 08.08.2019 08:58:53

kleo
Member

Re: [Erledigt] HTML Entities statt utf-8?

Ich würde vorschlagen, diese Dateien zu "konvertieren", damit man sie in der Zukunft leichter pflegen kann.

Offline

#17 08.08.2019 09:46:29

hamburgerhans
Banned

Re: [Erledigt] HTML Entities statt utf-8?

Kaffepause. Guten Morgen. Hübsch frisch ist es hier.

Das bestehende Verhalten des ckeditors ist seit Jahren bewährt und kein Fehler.

In einem CMS, das für den Content durchgehend unicode (utf-8) nutzt, ausgerechnet aber der Editor als einziger der Contentlieferer sich nicht daran hält, ist diese Aussage zugleich falsch und unlogisch!

Man kann natürlich auch mit den Weisheiten von vor über 15 Jahren weitermachen - "das war schon immer so, da müssen wir nichts ändern" -, obwohl man schon damals wußte, daß Mehrsprachigkeit und damit verbundener Zeichensatz mit Unicode zu realisieren ist. Die Möglichkeit mit Webfonts über OS-Systemgrenzen hinweg individuelle oder vorgegebene Fonts/Zeichensätze nutzen zu können. ist auch nur mit Unicode erreichbar.

Aber wie schon gesagt, ein derartiges Verhalten habe ich bisher bei anderen CMS nicht vorgefunden. Genau deshalb mein Erstaunen. Es ist zudem wie angemerkt nicht das einzige Fehlverhalten.

Kaffepause gleich schon wieder zuende. Einen schönen Tag wünsche ich allen.

Gruß, HH.

Last edited by hamburgerhans (08.08.2019 09:47:28)

Offline

#18 08.08.2019 09:51:08

florian
Administrator

Re: [Erledigt] HTML Entities statt utf-8?

Ja, danke, ich wusste, dass das "das war schon immer so, da müssen wir nichts ändern" mir vorgeworfen werden würde. Den Schuh ziehe ich mir aber nicht an. Ich habe begründet, warum das aktuelle Verhalten des CKE auch Vorteile hat.

Offline

#19 08.08.2019 10:03:28

hamburgerhans
Banned

Re: [Erledigt] HTML Entities statt utf-8?

So, 3 Minuten habe ich noch.

Ja, danke, ... / Ich habe begründet, warum das aktuelle Verhalten des CKE auch Vorteile hat.

Ja, das ist nachvollziehbar, aber - mit Verlaub - dennoch nicht zeitgemäß, weil "so gut wie niemand" mehr ISO nutzt, bei Mehrsprachigkeit erst recht nicht. Die beliebten Emoticons sind in den aktuellen Zeichensätzen übrigens auch nur über Unicode erreichbar.
Gruß, HH

Offline

#20 08.08.2019 10:09:05

webbird
Administrator

Re: [Erledigt] HTML Entities statt utf-8?

Leute, kommt mal runter. Es gibt viel wichtigere Dinge, über die man sich aufregen könnte. Trump zum Beispiel. (Ist Euch eigentlich aufgefallen dass keiner mehr über Erdogan oder Putin spricht?)

Bleiben wir mal sachlich: Auch in Zeiten von UTF8 ist es legitim, HTML Entities zu verwenden. Klar kann man sich mal hinsetzen und per Fleißarbeit alle Dateien in UTF8 umwandeln, insbesondere die Sprachdateien. (Hab ich bei "meinem" CMS irgendwann auch gemacht.) Nur, seien wir mal ehrlich: Was macht das WIRKLICH für einen Unterschied? Ü bleibt Ü und ß bleibt ß. Und wer möchte denn bitte die ganzen Module durchgehen und alles umwandeln? Wenn sich einer freiwillig meldet - feel free.

Das ist so ähnlich wie die ewige Debatte über HTML vs. XHTML oder Windows vs. Linux oder OOP vs. prozedural... Oder Tic-Tac-Toe.

Ich mache an dieser Stelle mal GERN darauf aufmerksam, dass ich selbst schon seit Jahren PRINZIPIELL nur noch Unicode verwende und hier trotzdem der Meinung bin, dass das kein MUSS ist. Wie gesagt, Ü bleibt Ü... Und Unicode ist auch nicht der Heilsbringer, da gibt's schließlich auch Varianten ohne Ende. Demnächst debattieren wir dann darüber ob UTF16 nicht Pflicht sein sollte weil UTF8 ja schon lange... Oder doch UTF32? Oder UCS2?

@HH: Du kannst Dir den CKE so einstellen wie es Dir beliebt.


Ich habe eine Amazon-Wishlist. wink
Erfolgreich vom eigentlichen Problem ablenken kann auch eine Lösung sein.

Offline

Liked by:

bernd, florian, mrbaseman, berny

#21 08.08.2019 10:10:33

webbird
Administrator

Re: [Erledigt] HTML Entities statt utf-8?

Hatte sich nicht neulich erst irgendwer beschwert dass die Änderungen in 1.4 hauptsächlich "unter der Haube" und daher nicht wirklich sichtbar seien? Und jetzt streiten wir uns über UTF8-Konvertierung? Findet das noch jemand kraus?


Ich habe eine Amazon-Wishlist. wink
Erfolgreich vom eigentlichen Problem ablenken kann auch eine Lösung sein.

Offline

Liked by:

bernd, florian, berny

#22 08.08.2019 10:11:05

bernd
Developer

Re: [Erledigt] HTML Entities statt utf-8?

IMHO ist die Konvertierung in HTML-Entities einfach nach wie vor (utf-8 hin oder her) die "sicherste" Methode um in unterschiedlichsten Umfeldern (Kunde verwendet - warum auch immer - ISO-8859-? / Datenbank ist nicht auf UTF-8 eingestellt / etc.) eine konstante Darstellung zu erhalten.

Ich hatte noch ein bischen damit rumgespielt. Die Konfiguration-Option "config.entities = false" des CKE arbeitet recht ordentlich, auch wenn man mal über den äöü-Tellerrand hinausblickt:
Umlaute und Anführungszeichen werden dann nicht mehr kodiert während "kritische" Zeichen (wie < und >) weiterhin kodiert werden.
Das Code2-Modul im HTML-Modus hingegen begibt sich hier auf sehr dünnes Eis, dort werden z.B. < und > auch nicht kodiert, was bei der Ausgabe dann zwangsweise invalides HTML ergibt...

Und wer es denn wirklich "schön in UTF-8" haben möchte (HH) setzt halt in Gottesnamen im CKE die entsprechende Konfigurations-Option.

Last edited by bernd (08.08.2019 10:14:21)


... nein in Europa verwenden wir beim Programmieren nicht € statt $ ...

Online

Liked by:

florian

#23 08.08.2019 11:17:21

michael-neu
Member

Re: [Erledigt] HTML Entities statt utf-8?

florian wrote:

Natürlich steht es jedem frei, für seine ganz spezifischen Bedürfnisse die Konfiguration des CKE in seiner eigenen Installation anzupassen.

webbird wrote:

@HH: Du kannst Dir den CKE so einstellen wie es Dir beliebt.

bernd wrote:

Und wer es denn wirklich "schön in UTF-8" haben möchte (HH) setzt halt in Gottesnamen im CKE die entsprechende Konfigurations-Option.

Nur damit ich vorsorglich Bescheid weiß: Ist es das Folgende, was man einstellen muss?

bernd wrote:

Es gibt diesbezüglich entsprechende Konfigurations-Optionen für den CKE, z.B. "config.entities = false"

Aber wieso "z.B."? Kommt da noch etwas dazu?

Last edited by michael-neu (08.08.2019 11:20:27)

Offline

#24 08.08.2019 11:45:31

colinax
Administrator

Re: [Erledigt] HTML Entities statt utf-8?

@michael

Folge dem Link in #11 da steht alles drinnen, und vorweg ja es gibt noch weitere entities settings.

@hamburgerhans

Ich habe jetzt nochmal genauer auf einer meiner Seiten nachgesehen, wo viele ä vorkommen, und ja die Entities sind hauptsächlich nur in den CKE Bereichen vorhanden.

Wie  teilweise geschrieben wurde, hat das Verhalten legacy Gründe, aber nicht nur, wir verwenden den CKE 4 (Released in 2012) dieser baut auf dem CKE 3 auf (Released in 2009).
Damals gab es fast noch kein utf-8 in Europa, es gibt jetzt immer noch Hoster die eine ISO-irgendwas (teilweise eine eigene Hoster Variante) statt utf-8 als charset verwenden.
Entsprechend der damaligen Zeit, wurde der CKE so geschrieben, da es seit 2018 den CKE 5 gibt, der zu den älteren Versionen inkompatible ist, wird sich daran nichts mehr ändern.

Und Ja, man kann, den CKE so einstellen, dass dieser uft-8, HTML5 und co korrekt einhalten muss, dass kann jeder für sich mit Hilfe der Readme's und CKE Doku selbst im CKE einstellen.

Da wir ein kleines Team sind, müssen wir natürlich schauen, dass das Ganze überall funktionieren soll, entsprechend lassen wir den CKE so, wie dieser von den Entwicklern programmiert wurde.


Wenn man in der Branche aktiv ist, bzw. die letzten 6-10 Jahre verfolgt hat, wie sich was entwickelt hat, ist man froh wenn's keine Probleme gibt.

Offline

#25 08.08.2019 12:52:41

hamburgerhans
Banned

Re: [Erledigt] HTML Entities statt utf-8?

Text von colinax konnte ich im Moment leider nicht berücksichtigen, meinen hatte ich schon vor der Mittagspause auf dem Stick. Aber eine schon: Wer als Hoster altes Zeugs anbietet, sollte Schmerzensgeld an die Admins zahlen. big_smile

Auch wieder nur ganz kurz.
Es hat nichts mit "schön" zu tun, sondern von einem CMS, welches seine Komponenten auf Unicode (utf-8) eingestellt hat, kann man erwarten, daß der Editor entsprechend funktioniert. Eher ist es im Jahr 2019 ein Sonderfall, wenn jemand kein Unicode nutzt. (läßt sich recherchieren)
Ausgeschlossen werden auch bestimmte Sprachen und Symbole.

Das genutzte Code2-Modul wurde nur für die Überprüfung des Verhaltens genutzt. Ein alternativer html-Editor zeigte das gleiche korrekte Ergebnis.

Zur Erinnerung.
Ab Version 5.4 benutzt PHP UTF-8 als Voreinstellung.
Wir sind bei 7.2/7.3. - wo es aus bekannten Gründen sinnvoller ist utf8mb4 zu nutzen
Parallel hierzu änderten sich auch die Eigenschaften von MySQL
Es gab schon ab MySQL-Version 4.1 (2005) den Zeichensatz utf-8, auch wenn meist der Standard Latin1 vorgegeben war. Man konnte umstellen.

Gruß, HH.

Last edited by hamburgerhans (08.08.2019 12:55:02)

Offline

Board footer

Powered by FluxBB

up