WBCE CMS Forum

WBCE CMS – Way Better Content Editing.

You are not logged in.

#1 22.07.2019 22:14:10

michael
Guest

Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Hallo,

heute Nachmittag habe ich WBCE entdeckt und kurz ausprobiert – und bin begeistert. smile

Als völliger Neuling, was CMS betrifft, bitte ich um Nachsicht für etwaige banale Fragen. Aber um zu wissen, ob WBCE für meine Bedürfnisse das Richtige ist, wäre es sinnvoll, manches vorweg zu klären.

Zentrales (aber nicht einziges) Element meiner Homepage sollte ein zweisprachiges Wörterbuch sein – für jedes Stichwort wäre eine Seite anzulegen. Derzeit umfasst es ungefähr 24.000 Stichwörter. Es kommen immer wieder neue dazu – aber der Kernbestand ist damit vorhanden.

Abbildungen (außer vielleicht auf der Startseite) und Medien würde es keine geben – der Inhalt der Homepage wäre so gut wie ausschließlich Text.

Derzeit habe ich das Wörterbuch auf meinem Rechner in zwei Word-Dateien und (parallel dazu) in einem Outliner-Programm ("MyInfo").

Weiters habe ich einen Teil davon in Form einer "hosted Wiki" (bei PBWorks) online gestellt. Mit der dortigen Funktionalität wäre ich zwar im Großen und Ganzen zufrieden. Aber vor allen aus Gründen der Unabhängigkeit von einem Hosting-Dienst würde ich gerne auf eine Lösung umsteigen, bei der ich die Software und den Datenbestand am Rechner habe.

Von WBCE war ich vom ersten Moment an begeistert, weil der Übertrag der Texte aus der Word-Datei (copy – paste) nahezu ohne Veränderung oder Verlust der Formatierung funktionierte: Schriftart und -größe, Farben, Tabellen und sogar die Zeilenabstände blieben erhalten. So perfekt wie mit WBCE hat das noch mit keiner anderen von mir getesteten Lösung funktioniert! (Auch bei PBWorks muss man manches zeitaufwändig "nachformatieren".) Das ist ein wesentlicher Grund, warum ich mich gerne in WBCE vertiefen würde.

Meine ersten Fragen zum Thema wären nun:

1. Eignet sich WBCE für ein solches Projekt? Es würde sich eben weniger um eine Homepage im herkömmlichen Sinn handeln, sondern eher um eine Art Wiki mit vielen stichwort-bezogenen Einzelseiten. (Auf Möglichkeiten zur Mitarbeit Dritter kommt es mir aber nicht an – anders als bei einer typischen Wiki, wäre ich der Einzige, der den Inhalt gestalten würde.)

2. Wie es bei einem Wörterbuch naheliegt, sollte die Suchfunktion möglichst komfortabel funktionieren.

Ideal wäre es, wenn die Suche (bei Bedarf) auf die Seitennamen (also die Stichworte) beschränkt werden könnte (also keine Suche im Seiteninhalt stattfindet). Oder wenn die Suche "case sensitive" (Unterscheidung nach Groß- und Kleinbuchstaben) in Frage käme.  Das alles muss aber nicht sein. Nur sollte es dann eine andere Möglichkeit geben, eine bestimmte Seite (und damit ein bestimmtes Stichwort) "punktgenau" ansteuern zu können.

Die Lösung, die ich dafür (sowohl in meiner Word-Datei als auch auf PBWorks) gewählt habe, hat sich bewährt: Jedem Stichwort bzw. Seitennamen ist ein Doppelpunkt (ohne Abstand) vorangestellt. Also zum Beispiel :KOMMEN

Wenn man auf diese Weise – also mit vorangestelltem Doppelpunkt – sucht, wird auch vermieden, dass jene Seiten/Stichworte angezeigt werden, in denen "kommen" nur im Wortinneren enthalten ist (also ankommen, bekommen, entkommen, herkommen usw.).

Wäre eine solche Methode auch für WBCE praktikabel? Oder gäbe es dafür überhaupt eine "elegantere" Lösung? Das müsste ich eben von Beginn an wissen, weil davon meine Seitenbenennung abhängt.

Das wär's für den Anfang. Vielen Dank.

Last edited by florian (02.08.2019 10:53:10)

Liked by:

florian

#2 22.07.2019 22:37:55

ice
Member

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Nur kurz, gehe gleich schlafen: Ich finde, dass Du mit einem (nach deinem Wunsch) selbst gehosteten Wiki besser fahren würdest. Ich selbst verwende dokuwiki https://www.dokuwiki.org/dokuwiki

Schon allein, weil Dir die Schreibweise :Stichwort schon geläufig ist. Es gibt für Dokuwiki auch ein plugin, welches die normale Wikiformatierung durch einen Editor (Ckeditor) ersetzt. Du kannst dort dann genauso wie bei WBCE deinen Text aus Word hineinkopieren.

Nur so als Idee ...

Last edited by ice (22.07.2019 22:39:34)

Offline

Liked by:

florian

#3 22.07.2019 23:23:07

stefanek
Developer

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Bei 24k Stichwörtern die Du alle als Einzelseite anlegen möchtest würde ich sagen, neee... nicht so gut geeignet. Nicht unmöglich, aber  nicht ideal.

Ich habe ein Projekt in Aussicht wo ein Glossary Modul entstehen könnte, aber das ist noch nicht sicher und hängt sehr von meiner anderweitigen Auftragslage ab.

Die Tipps von ice würde ich mir zu Herzen nehmen, sind ein wohlgemeinter Rat.

Gruß,
Christian


"All the knowledge I possess everyone else can acquire, but my heart is all my own."
Johann Wolfgang von Goethe

Offline

Liked by:

florian

#4 23.07.2019 14:46:38

michael
Guest

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Danke für eure Antworten und Infos.

Was dokuwiki betrifft: Ich habe es nach deinem Vorschlag, ice, kurz ausprobiert (die Version mit dem integrierten Webserver) und habe dabei auch das auf dem CKEditor beruhende Plugin installiert ("CKGEdit Plugin"). Das Ergebnis des Hineinkopierens aus Word war leider eine Katastrophe (sowohl mit dem Ableger des CKEditors als auch mit dem Editor von dokuwiki selbst): Im Editor-Fenster ist die Formatierung ja noch ganz gut erhalten (wenn auch nicht so gut wie mit WBCE), aber nach dem Abspeichern ist so gut wie alles an Formatierung verlorengegangen (sogar inklusive Zeilenumbrüchen; Farben, Tabellen usw. sowieso).

Wenn ich da also nicht irgendeine Einstellungsmöglichkeit übersehen habe, ist dokuwiki für meinen wesentlichen Arbeitsschritt - also das copy/paste aus Word - ganz ungeeignet.

Daher möchte ich die Idee, WBCE zu verwenden, im Moment noch nicht ganz aufgeben und zu Christians Kommentar nachfragen:

Wenn du schreibst, es sei für meinen Zweck "nicht so gut geeignet" bzw. "nicht ideal": Meinst du damit die Benützung des Programms bei der Erstellung der Seiten? Also dass nur die Handhabung zu umständlich oder langwierig wäre und es z.B. mit einer Wiki-Software bequemer ginge? Oder beziehst du dich auf mögliche technische Probleme, also insbesondere eine Überforderung des WBCE, weil es mit einer so großen Seitenanzahl eventuell nicht umgehen kann (und dadurch z.B. langsam würde oder überhaupt einfrieren könnte). Der erste Fall würde mich nicht unbedingt abschrecken (es wäre mir den Arbeitsaufwand wert, wenn das Ergebnis im Großen und Ganzen meinen Vorstellungen entspricht). Im zweiten Fall, also möglichen technischen Schwierigkeiten, hätte es natürlich keinen Sinn, es mit WBCE zu probieren.

Was deine Anmerkung betrifft, "Bei 24k Stichwörtern die Du alle als Einzelseite anlegen möchtest ...". Ich wäre für Alternativen zum Anlegen von Einzelseiten auch offen, weiß aber keine. Ich habe es damit versucht, mehrere (ein paar dutzend) Stichworte auf einer gemeinsamen Seite anzulegen, aber das ist keine praktikable Lösung: Die Suche ist dann hängengeblieben.

Noch ein Wort zur Stichwort-Suche mit WBCE: Ich habe das kurz getestet, und eine solche Suche funktioniert ganz passabel, wenn man die Seitenbenennung z.B.  mit der von mir geschilderten Methode "Doppelpunkt vor Stichwort" durchführt. Ideal läuft das Ganze zwar nicht (es ist halt keine Index-Suche mit Filter, Autovervollständigung etc.), aber ich könnte mich damit abfinden, wenn WBCE für mich insgesamt in Frage käme.

#5 23.07.2019 15:23:27

bernd
Developer

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Also 24.000 Einzelseiten ist halt schon 'ne ordentliche Hausnummer.

Bei der Anzahl dürfte auf alle Fälle der Aufbau des PageTree im Backend seeeeehr zäh werden wenn er nicht sogar durch einen Timeout abgebrochen wird.
Das hängt mit Sicherheit auch bischen mit der Server-Konfiguration und -Leistungsfähigkeit zusammen.

An anderer Stelle hier im Forum hat Chio schon davon berichtet das es bei ~1000 Seiten im Backend schon nicht mehr wirklich rund läuft.
O.k. da könnte man sich mit einem Frontend-Edit behelfen aber spätestens bei Neuanlegen von Seiten muß man halt doch wieder im Backend in die Seitenverwaltung.

Welche "Nebenwirkungen" noch auftreten können? Kein Ahnung! Ich glaub nicht das hier schon jemand Erfahrungen mit solch einer großen Anzahl von Seiten gemacht hat ... mehrere hundert, ja - aber im zweistelligen Tausenderbereich ...


... nein in Europa verwenden wir beim Programmieren nicht € statt $ ...

Online

#6 23.07.2019 16:52:47

florian
Administrator

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Wenn die 24k Begriffe sich nach bestimmten Themengebieten / Kapiteln aufteilen lassen, könntest Du versuchen, das mit "nur" ein paar hundert SEiten zu machen, sprich für jedes Kapitel / Themenfeld o.ä. eine Seite und die Stichworte dort dann mittels der Module OneForAll, Topics o.ä. anlegen. Wobei diese Module wahrscheinlich auch bei 1000en Einträgen an ihre Grenzen stoßen.
Ich fürchte auch, dass die Suche nicht für derartige Datenmengen ausgelegt ist und in einen Timeout laufen würde.

Ganz ehrlich, so ungern ich das sagen muss, ich glaube, für ein Wörterbuch diesen Umfangs ist WBCE nicht geeignet.

Offline

#7 23.07.2019 22:47:48

michael
Guest

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Für ein Aufteilen der Stichworte nach Themengebieten oder Ähnlichem sehe ich leider keine praktikable Möglichkeit.

Jedenfalls haben mir eure Bedenken die Entscheidung jetzt leicht gemacht: WBCE kommt damit für das Wörterbuch nicht in Frage. Es würde zwar sicherlich viele Monate dauern, bis ich auch nur einen Bruchteil der ca. 24.000 Seiten angelegt hätte - und daher würde über längere Zeit wahrscheinlich alles reibungslos laufen. Aber umso größer wäre die Enttäuschung, wenn sich dann irgendwann später doch die von euch geschilderten Probleme einstellen.

Daher danke, dass ihr mich von Anfang an über eure Einwände informiert habt.

Ich kann daher Florians vorigen Satz spiegelbildlich aus meiner Perspektive umformulieren wink :

"Ganz ehrlich, so ungern ich das sagen muss, ich glaube, für mein Wörterbuchprojekt ist WBCE nicht geeignet."

Schade, weil mir das Programm von Anfang an sympathisch war. Aber ich überlege, ob ich es vielleicht für andere, kleinere Aufgabenstellungen einsetzen könnte.

Daher nicht wundern, wenn ich mich mit etwaigen Fragen zu WBCE weiterhin hier im Forum melde.  wink

Last edited by michael (23.07.2019 22:49:30)

Liked by:

stefanek, florian

#8 25.07.2019 10:50:16

webbird
Administrator

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Noch ein Tipp zum Wiki: Es gibt ganz brauchbare Konverter, zum einen, um den ganzen Word-Markup-Mist zu entfernen, zum anderen, um dann daraus Wiki-Markup zu machen. Ich habe jetzt grad keinen Link zur Hand, aber wenn Du mal danach suchst, wirst Du bestimmt fündig. Es hängt ja am Ende auch vom Wiki der Wahl ab, wobei ich DokuWiki besser finde als MediaWiki. Die Dialekte sind stellenweise etwas unterschiedlich, daher solltest Du Dich erst für Dein Zielsystem entscheiden und dann nach Konvertern suchen.


Ich habe eine Amazon-Wishlist. wink
Erfolgreich vom eigentlichen Problem ablenken kann auch eine Lösung sein.

Offline

#9 25.07.2019 10:52:45

webbird
Administrator

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Das Teil ist als veraltet markiert, aber vielleicht funktioniert es ja trotzdem noch:
https://www.dokuwiki.org/plugin:docimporter

Falls es mit der aktuellen Version vom DokuWiki nicht funktioniert, könntest Du eine ältere installieren und nach dem Import ein Update machen. Wäre zumindest einen Test mit einer handvoll Seiten wert.


Ich habe eine Amazon-Wishlist. wink
Erfolgreich vom eigentlichen Problem ablenken kann auch eine Lösung sein.

Offline

#10 25.07.2019 15:41:35

hamburgerhans
Banned

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Das folgende ist nur als Anregung zu betrachten, falls jemand sich hingerissen fühlt.  :hitzewallungen:

Mit ein wenig Querdenken geht es möglicherweise, wobei die Grundvoraussetzung, ein entsprechend strukturiertes xml, csv oder ähnliches Format vorliegen zu haben, erfüllt sein muß. Damit wäre eine Plazierung in eine Datenbank, hier MySQL, möglich. Für Excel gab es, wenn ich recht erinnere, mal Konvertierungswerkzeuge, oder auch Serverscripts, welche die Konvertierung ermöglichten.

Mit der gewünschten Suchfunktion, die einem eigenen Algorithmus folgt, würde die Ausgabe über eigens dafür eingerichtete Seite, oder global mit einem entsprechenden Suchmodul erfolgen.

Im Backend gäbe es demnach keine tausende Seiten zu sehen, sondern nur eine Suchschablone.
Für den angeforderten Inhalt aus der Datenbank wäre aber ein Datenbankwerkzeug vonnöten!


Da nun nicht bei WBCE die Last anfällt, geht's nur noch um die Leistungsfähigkeit des Hosters, bzw. den Tarif.

Ein Beispiel mit XML in MySQL: Wörterbuchnetz

Gruß, HH.

Last edited by hamburgerhans (25.07.2019 15:50:13)

Offline

#11 25.07.2019 16:52:31

boeseroeser
Guest

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Ich weiß jetzt ja nicht, was für eine Art Wörterbuch das sein soll, welche besonderen Anforderungen es gibt.
Und wie umfangreich die Einträge sind.

MIt der Basisausstattung von WBCE wird man da nicht weit kommen, aber man kann sich natürlich ein Modul machen.
Sowas zb: http://ute.at/search/index.php?referrer=6&string=Deiser
http://ute.at/cms/haus-und-hofnamen/burgkirchen.html
(steinalt, aber läuft immer noch)

Die Hauptarbeit ist es, die vorhandenen Daten sauber(!) zu importieren, aber auch das ist machbar.

#12 25.07.2019 19:13:24

michael
Guest

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Danke für eure Tipps und Überlegungen.

1.

webbird wrote:

Das Teil ist als veraltet markiert, aber vielleicht funktioniert es ja trotzdem noch:
https://www.dokuwiki.org/plugin:docimporter
[...]
Wäre zumindest einen Test mit einer handvoll Seiten wert.

Ja, das könnte ich ausprobieren.

Wobei aber gerade DokuWiki ohne Datenbank arbeitet, und da hatte ich mir schon  früher mal notiert, was jemand über etwaige Kapazitätsgrenzen von DokuWiki schrieb:

"That lack of a database is nice, in that it makes installation quick and easy. But it's also a potential drawback, albeit a minor one. DokuWiki writes all its entries to flat files and that could affect scalability, and to some extent performance, if your wiki ever became extremely large. […] For small to mid-sized or even large-ish sites, DokuWiki is great. If you’re worried your wiki might need to grow very large some day (like, to the point where load balancing across multiple servers is required, for instance — we're talking big!), DokuWiki may not be for you."

(https://malcontentcomics.com/systemsboy … uwiki.html)

Wahrscheinlich hat der Verfasser dabei an mehr als meine Sammlung von 24.000 Seiten/Stichwörtern gedacht. Aber sicher müsste ich mir halt schon sein können, dass diese Datenmenge dort ohne Probleme zu bewältigen wäre.

2.

hamburgerhans wrote:

Mit ein wenig Querdenken geht es möglicherweise, wobei die Grundvoraussetzung, ein entsprechend strukturiertes xml, csv oder ähnliches Format vorliegen zu haben, erfüllt sein muß. Damit wäre eine Plazierung in eine Datenbank, hier MySQL, möglich.

Ich habe die Datensammlung ja auch komplett in einem Outliner oder Personal Information Manager (PIM) oder wie immer man das nennt. Das ist das Programm "MyInfo". Darin habe ich für jedes Stichwort eine eigene Seite (dort "document" genannt) angelegt. (Der Inhalt wurde ebenfalls per copy und paste aus Word übernommen.) Und als du jetzt von "css" geschrieben hast, ist mir eingefallen, dass MyInfo entsprechende Exportmöglichkeiten anbietet, nämlich "Export to Standard CSV (comma-delimited) file" und "Export to Excel CSV (semicolon-delimited) file". Also wenn das geignet wäre … Technisch müsste ich mich aber von Null einarbeiten, weil ich noch nie mit csv oder Ähnlichem zu tun hatte.

hamburgerhans wrote:

Im Backend gäbe es demnach keine tausende Seiten zu sehen, sondern nur eine Suchschablone.

Das klingt gut.

hamburgerhans wrote:

Da nun nicht bei WBCE die Last anfällt, geht's nur noch um die Leistungsfähigkeit des Hosters, bzw. den Tarif.

Ich hätte den Gratis-Webspace bei bplaced. Dort hätte ich das Ganze gern hochgeladen.

hamburgerhans wrote:

Ein Beispiel mit XML in MySQL: Wörterbuchnetz

Ja, das Grimm-Wörterbuch. wink Das hatte ich mir schon früher mal als Beispiel notiert, wie mir ein Wörterbuch gefallen könnte.

Die haben auch eine sehr detaillierte technische Erläuterung dazu:
http://dwb.uni-trier.de/de/die-digitale … lisierung/
http://dwb.uni-trier.de/de/die-digitale … zeichnung/
http://dwb.uni-trier.de/de/die-digitale … datenbank/

Aber das war mir natürlich immer alles zu hoch.

3.

boeseroeser wrote:

Ich weiß jetzt ja nicht, was für eine Art Wörterbuch das sein soll, welche besonderen Anforderungen es gibt.
Und wie umfangreich die Einträge sind.

Die besondere Anforderung sehe ich am ehesten darin, dass es aus Gründen der Übersichtlichkeit diverse Formatierungen bieten soll, die man in Online-Wörterbüchern meist nicht findet (mehrere Schriftfarben, allenfalls auch zwei-drei zusätzliche Hintergrundfarben, Tabellen, natürlich Links und Anker, …).

Sehr umfangreich sind die meisten Einträge meinem Gefühl nach nicht. Hier ein Beispiel für einen schon etwas größeren Eintrag, der auch die meisten der angesprochenen Formatierungsmerkmale enthält (Inhalt des Stichworts "AUCH"):
http://enalexiko.pbworks.com/w/page/62557628/%3AAUCH

Aber so aufwändig ist nur ein Bruchteil der Stichwörter gestaltet. Manchmal besteht der  Inhalt auch nur aus ein oder zwei Wörtern (zB. bei "ABONNEMENT") wink :
http://enalexiko.pbworks.com/w/page/112 … T%2C%20das

boeseroeser wrote:

MIt der Basisausstattung von WBCE wird man da nicht weit kommen, aber man kann sich natürlich ein Modul machen.

Ich fürchte, damit wäre ich technisch (weit) überfordert.

4.
Ich wollte noch etwas im Nachtrag zu Florians letztem Beitrag oben hier in diesem Thema und meiner Antwort darauf erwähnen.

Florian meinte:

florian wrote:

Wenn die 24k Begriffe sich nach bestimmten Themengebieten / Kapiteln aufteilen lassen, könntest Du versuchen, das mit "nur" ein paar hundert SEiten zu machen, sprich für jedes Kapitel / Themenfeld o.ä. eine Seite und die Stichworte dort dann mittels der Module OneForAll, Topics o.ä. anlegen. Wobei diese Module wahrscheinlich auch bei 1000en Einträgen an ihre Grenzen stoßen.

Ich antwortete voreilig, dass ich für ein solches Aufteilen keine praktikable Möglichkeit sähe, und das war falsch. Gerade bei Wörterbüchern kann man nämlich schön in "Kapitel" aufteilen, nämlich in Buchstaben bzw. Unterabschnitte von Buchstaben.

Konkret am Beispiel des deutschen A (übrigens jener Buchstabe mit den meisten Stichwörtern, glaube ich). Der umfasst etwa 1900 Stichwörter. Hier könnte man also zB. aufteilen in (Stichwörter von) "Aa – Ans" und "Ant – Az". Ich habe es überprüft. Jeder der beiden Teile hätte ungefähr die Hälfte der Vokabel mit A, also etwa 950 Stichwörter. Bei Bedarf könnte man natürlich auch dritteln statt halbieren.

Zum Thema eines etwaigen Timeout habe ich auch folgenden Thread gefunden, der zufällig nahezu gleichzeitig mit meinem erstellt wurde (ohnedies von dir, boeseroeser, wie ich gerade sehe wink ): https://forum.wbce.org/viewtopic.php?id=2945
Vielleicht könnte auch der Vorschlag helfen, den Bernd dort macht (Posting # 2), um das Problem mit der Datenmenge in den Griff zu bekommen.

Allerdings wird wohl immer noch der Unsicherheitsfaktor bleiben, den Florian erwähnte:

florian wrote:

Ich fürchte auch, dass die Suche nicht für derartige Datenmengen ausgelegt ist und in einen Timeout laufen würde.

Und ein typisches Nachschlagewerk wie Lexikon, Wörterbuch usw. macht natürlich nur Sinn, wenn die Suche reibungslos funktioniert.

Last edited by michael (25.07.2019 19:15:17)

#13 25.07.2019 19:43:46

hamburgerhans
Banned

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Dieses Datenbankprojekt "MySQL English Dictionary" zeigt ,wie sich eine Textdatei (Trennung nur mit CR?)  importieren läßt. Die könnte eine Vorlage sein., zumindest ist es aber ein anschauliches Beispiel.

Ich vermute mal, daß sich im Forum einige befinden, die Dir den Vorgang bzw. die Vorgehensweise erläutern können, und möglicherweise bei der Umsetzung behilflich sind.
Gruß, HH.

ps. Zu den Stichworten "halbieren, dritteln" bzw. zur Unterteilung.
Bei der von mir vorgeschlagenen Vorgehensweise gibt es keine Seiten, sondern nur fortlaufende Datenbankeinträge, die per Suchformular abgefragt , und auf einer Seite angezeigt werden. Das funktioniert im Prinzip wie die WBCE-Suche.
Gruß, HH..

Last edited by hamburgerhans (25.07.2019 20:01:07)

Offline

#14 25.07.2019 20:04:04

stefanek
Developer

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Nur mal so als Anregung. Ich weiß zwar nicht wie das Dokument derzeitig gestaltet ist, aber man kann ein Word Dokument mit LibreOffice in das ODT Format exportieren und dieses ist an sich in einem XML Format gehalten.
Mit ein wenig Arbeit, str_replace und ähnlichen Methoden könnte man dann dieses XML so anpassen, dass man eine Vorlage hat, die man dann in eine SQL Tabelle laden kann.

Auf keinen Fall würde ich 24k Einträge "zu Fuss" übertragen.  monkey

Gruß,
Christian


"All the knowledge I possess everyone else can acquire, but my heart is all my own."
Johann Wolfgang von Goethe

Offline

#15 25.07.2019 20:29:23

boeseroeser
Guest

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Mit XML kommst du da nicht weiter. Am ehesten noch mit dem, was MS Word für HTML hält.

#16 25.07.2019 20:35:25

stefanek
Developer

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

So so..


"All the knowledge I possess everyone else can acquire, but my heart is all my own."
Johann Wolfgang von Goethe

Offline

#17 25.07.2019 20:47:42

hamburgerhans
Banned

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Wozu xml angebracht sein kann, zeigt die Erwähnung von Michael "Datenbank zu Grimm".
Hier wurde anscheinend jeder Eintrag - was in der Contentverwaltung für Crossmedia üblich ist - als xml-Content in die DB eingefügt.
Gruß, HH.

Nachtrag: Daß bei der Vorlage leider nicht Excel oder sonst taugliches Werkzeug für die Daten verwendet wurde, ist im professionellen Umfeld tatsächlich ein Handicap. Einen Aufbau nach TEI im nachhinein hinzubekommen dürfte kaum machbar sein, womit dann nur noch ein vereinfachtes xml-Schema nutzbar wäre. Dies ist aber für ein Listing, so wie es bisher sichtbar war und ist, kein Nachteil. Alternativ reicht ja evtl. ein Aufbau wie im angegebenen Datenbankprojekt "MySQL English Dictionary".

Last edited by hamburgerhans (25.07.2019 22:49:02)

Offline

#18 26.07.2019 12:41:39

webbird
Administrator

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Mit XML als Basis kann "man" alles machen. Erstaunlich(st)e Dinge. Dafür gibt es XSLT. Gerade bei Datenbanken wird XML sehr hoch gehandelt. Allerdings ist das ein Thema, in das man sich wirklich sehr lange und gründlich einarbeiten muß. (Was ich auch nicht getan habe, ich habe hauptberuflich aber einen Eindruck gewonnen.) Hast Du die Daten erst einmal als XML vorliegen, kannst Du sie praktisch in jedes beliebige Format umwandeln - HTML, PDF, CSV, SQL-Statements... völlig egal. Du brauchst "nur" das passende XSLT.

Aber nur weil etwas technisch möglich ist, muß es für das konkrete Projekt noch nicht die richtige Lösung sein. Allerdings widerspreche ich der pauschalen Aussage "mit XML kommst Du nicht weiter", auch wenn das für den konkreten Fall stimmen mag. Aber das liegt dann halt nicht am XML.


Ich habe eine Amazon-Wishlist. wink
Erfolgreich vom eigentlichen Problem ablenken kann auch eine Lösung sein.

Offline

Liked by:

stefanek

#19 26.07.2019 13:04:38

stefanek
Developer

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Je nachdem wie die Dateien in dem jetzigen Word Dokument vorliegen, kann eine mit OOO erstellte ODT Datei im XML Format die einzelnen Begriffe samt Definition schön in einzelne Segmente aufteilen, die man dann so weiter verarbeiten kann, dass die Daten dann in die DB eingespeist werden können. Ich würde ein solches Unterfangen nicht mit XSLT machen (weil ich keine Erfahrung auf diesem Gebiet habe) sondern mit PHP aus der XML ein Array generieren welches ich dann nach Belieben in die DB schreiben kann.

Ich glaube, bin mir aber nicht sicher, dass Chio eher die HTML Formatierung selbst meinte. Da kommt man wahrscheinlich in der Tat mit dem MS-Word "HTML" besser weiter als mit XML. Aber darum ging es in meiner ersten Aussage nicht.  wink
Das "müde" so so... kam nur, weil es zu heiß war zu dem Zeitpunkt mehr zu schreiben.  lol


"All the knowledge I possess everyone else can acquire, but my heart is all my own."
Johann Wolfgang von Goethe

Offline

#20 26.07.2019 13:19:15

hamburgerhans
Banned

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Die "nackten" aber strukurierten Daten in der DB nachträglich normierten XML-Elementen zuzuordnen ist auch machbar. Diese lassen sich dann entweder in eine Datei schreiben oder direkt in eine neue DB überführen.

Vermutlich wäre es sinnvoll einen Teil z.B. A-C der Worddatei hier abzulegen, damit jeder eine Einsicht in die Konvertierungsproblematik bekommt.
Gruß,HH.

Last edited by hamburgerhans (26.07.2019 13:20:15)

Offline

Liked by:

stefanek

#21 26.07.2019 13:39:36

florian
Administrator

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Thema hat sich erledigt - es gab persönliche Differenzen. Der TO hat sich gegen WBCE entschieden.
Es tut mir leid für alle, die sich hier Gedanken über die Umsetzung der Angelegenheit gemacht haben.

Offline

#22 26.07.2019 14:08:35

webbird
Administrator

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

Kann doch nie schaden, wer weiß, wofür es irgendwann mal gut ist.


Ich habe eine Amazon-Wishlist. wink
Erfolgreich vom eigentlichen Problem ablenken kann auch eine Lösung sein.

Offline

Liked by:

hamburgerhans

#23 26.07.2019 14:46:15

byteworker
Member

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

florian wrote:

Thema hat sich erledigt - es gab persönliche Differenzen. Der TO hat sich gegen WBCE entschieden.
Es tut mir leid für alle, die sich hier Gedanken über die Umsetzung der Angelegenheit gemacht haben.

Ok darum war das andere Thema nun zu. Verstanden!

Offline

#24 26.07.2019 14:53:07

boeseroeser
Guest

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

boeseroeser wrote:

Mit XML kommst du da nicht weiter. Am ehesten noch mit dem, was MS Word für HTML hält.

Damit meinte ich natürlich den konkreten Fall.

XML ist sicher eine feine Sache, wenn man von A bis Z strukturierte und störungsfreie Abläufe hat. Sobald eine Textverarbeitung (egal welche) involviert ist, ist das vorbei.

Dass XML die Lösung für alles ist, glauben übrigens nur Leute, die noch nie ernsthaft damit zu tun gehabt haben. Ich hab schon - XML kann ein unsägliches Frickelwerk sein ;-) Vor allem, wenn die ideale Welt  von der realen Welt abweicht. Dann wünscht man sich, man wäre das anders angegangen.

#25 26.07.2019 15:46:37

stefanek
Developer

Re: Konvertierung von großen Word-Dokumenten (war: WBCE - für Wörterbuch geeignet?)

so so so so so...  wink


"All the knowledge I possess everyone else can acquire, but my heart is all my own."
Johann Wolfgang von Goethe

Offline

Board footer

Powered by FluxBB

up