Benutzer Diskussion:MattisManzel/Mehrsprachige Kommunikation

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Und was heißt das nun alles auf Deutsch? Jeder Satz wird in mehreren Sprachen abgespeichert, und der Nutzer kann wählen, in welcher Sprache er die Sätze eines Artikels angezeigt bekommen will? --Kerbel 17:45, 10. Aug 2004 (CEST)

Hi Kerbel,
Wenn du dich auf den derzeitigen Zustand in der Gruppe MultilingualExperiment auf CommunityWiki beziehst, dann: Ja, das ist richtig.

[de]Ich markiere die Sprache, wie hier am Anfang geschehen. Das verändert die Hintergrundfarbe für diesen Absatz. Dieser wäre blass-gelb auf CW (CommunityWiki).
[en]Dieser neue Absatz wäre blass-blau, weil Englisch.
[fr]Dieser blass-rot. Französisch.

Wähle ich keine Filter aus (= zeige alle Sprachen) sieht man alles. de und en angewählt und "zeigen" geklickt und es verschwinden alle Französischen Absätze aus dem angezeigten Text.

Der Editiermodus ist leider noch nicht so weit - weshalb sich mit der Technik bislang auch nur eingeschränkt arbeiten lässt. Der Anzeigemodus jedoch ist bereits fast perfekt. Wir denken noch daran die Hintergrundfarbe eines Textes ganz verschwinden zu lassen, wenn nur eine Sprache angezeigt wird. Damit wäre dann der gefilterte mehrsprachige Text einer Seite identisch mit dem einer einsprachigen Seite gleichen Inhalts.
Ein Problem ist die Datenmenge. Sprachen übertragen zu müssen, die dann nicht angezeigt werden, ist nicht sinnvoll und kann, besonders wenn es viele Sprachen sind, recht hinderlich sein. Vorschläge kamen, die einzelnen Sprachen in unterschiedlichen Datenbanken zu speichern. Hier hoffe ich auf Inspirationen vor Technikern, die sich auskennen - ich bin derer leider keiner. Ich würde diese sogleich an meine teils technisch recht begabten Freunde auf CW weiterleiten. MattisManzel 19:31, 10. Aug 2004 (CEST)

He, hallo Mattis. Hab die Antwort jetzt erst entdeckt.

Ob es was bringt, wenn man neben der Hauptdiskussion noch Nebendiskussionen führt, weiß ich nicht. Schaden kann es aber eigentlich nicht, wenn ich anführe, was mir zu diesen Sachen in den Sinn kommt. Zwei Punkte habe ich:

  • Solch ein Vorgehen muss eigentlich zu sehr komplizierten Editier-Prozessen führen. Wann immer jemand darauf verfällt, einen Satz zu ändern, muss ja eine Aufforderung an alle Übersetzer gehen, die Änderungen zu übernehmen.
  • Wenn ich selber Texte übersetze, dann nehme ich mir die Freiheit, hier und da mal zwei Sätze der anderen Sprache zu einem Satz zusammenzufassen oder auch die Aussagen eines längeren Sätze auf zwei Sätze zu verteilen. Diese Freiheit würde wegfallen, wenn die Vorgabe lautet, dass ein Satz der einen Sprache genau einem Satz der anderen Sprache entsprechen soll. Ich vermute also mal, dass es besser ist, die Texte in "Sinneinheiten" aufzuteilen, die aus ein bis drei Sätzen bestehen können, statt sich strikt an eine Aufteilung in Sätze zu halten.

Wie auch immer es sich damit verhalten mag - auf jeden Fall Danke für die Erläuterungen. Ich sehe dadurch jetzt etwas klarer. --Kerbel 23:11, 23. Aug 2004 (CEST)

Sinneinheiten. Sehr gut. |Die Unterteilung in Sätze hätte ein elendiges tagging von Punkten zu Folge gehabt, die u.U. kein Satzende markieren: Abkürzungspkt. und auch Fortsetzungspunkte ... |Fürwahr ist es oft sinnvoll, lange Sätze in mehrere Sätze zu zerteilen (oder auch umgekehrt). |Zur Markierung bietet sich das "|" an. |Es sollte möglich sein, dies Zeichen aus dem Text auszublenden. Es ist schließlich nur für die Übersetzung von Bedeutung. |Wer übersetzt, kann sich die Sinneinheiten selbst zurechtrücken, so wie es ihm sinnvoll erscheint. |Ist die bereits durch jemanden zuvor geschehen und ein Text bereits in eine Sprache übersetzt, so besteht diese Freiheit nicht mehr. |Ich vermag im Moment nicht zu sagen, wie gross diese Sinneinheiten würden. |Ich versuche sie hier mal so zu setzen, wie es mir sinnvoll erscheint.

Im Translate-Editiermodus mit automatischer Vorübersetzung, die jedoch nur gespeichert wird, wenn die Übersetzung bearbeitet oder als richtig markiert wurde, sähe der obige Absatz wie folgt aus. Selbstverständlich müsste der verschiedensprachige Text nicht untereinander dargestellt werden, sondern links das Original und rechts die automatische Vorübersetzung. Mir fehlen die Fähigkeiten im Umgang mit Tabellen um dies hier auszuführen. Wenn jemand dies versuche würde, wäre es erfreulich.


Sinneinheiten. Sehr gut.
Sense units. Very well.

|Die Unterteilung in Sätze hätte ein elendiges tagging von Punkten zu Folge gehabt, die u.U. kein Satzende markieren: Abkürzungspkt. und auch Fortsetzungspunkte ...
|Die partitioning into sentences would have a elendiges day-went from points to consequence had, which mark possibly no end of record: Abbreviation point and also points of continuation...

|Fürwahr ist es oft sinnvoll, lange Sätze in mehrere Sätze zu zerteilen (oder auch umgekehrt).
|Fuerwahr are often meaningful it, long sentences into several sentences to divide (or also turned around).

|Zur Markierung bietet sich das "|" an.
|Zur marking is offered "|" on.

|Es sollte möglich sein, dies Zeichen aus dem Text auszublenden. Es ist schließlich nur für die Übersetzung von Bedeutung.
|Es should be possible to fade out this indication from the text. It is finally only for the translation of importance.

|Wer übersetzt, kann sich die Sinneinheiten selbst zurechtrücken, so wie es ihm sinnvoll erscheint.
|Wer translated, can the sense units themselves adjust itself, as it to it appears meaningful.

|Ist die bereits durch jemanden zuvor geschehen und ein Text bereits in eine Sprache übersetzt, so besteht diese Freiheit nicht mehr.
|already by means of someone before taken place and if a text Ist into a language already translated, then this liberty does not exist any longer.

|Ich vermag im Moment nicht zu sagen, wie gross diese Sinneinheiten würden.
|Ich is not able to say for the moment, how large these sense units became.

|Ich versuche sie hier mal so zu setzen, wie es mir sinnvoll erscheint.
|Ich it tries to set here times as, as it for me meaningfully erscheint.


Nun nimmt man sich eine Sinneinheit nach der anderen vor, korrigiert die automatische Vorübersetzung und speichert die Sinneinheit ab.
Zum Beispiel:

|Die Unterteilung in Sätze hätte ein ermüdendes tagging von Punkten zu Folge gehabt, die u.U. kein Satzende markieren: Abkürzungspkt. und auch Fortsetzungspunkte ...
|The separation into sentences would have had the tiresome consequence to be obliged to tag fullstops which possibly do not mark an end of a sentence: Abbreviation fullstops/points and also fullstops/points of continuation...

Ob es im Zusammenhang oben "point" oder "fullstop" heisst, weiss ich nicht und vertraue auf den nächsten Englischsprachigen Bearbeiter, dies zu richtig zu stellen.

Fazit: Eine Übersetzung ist immer noch ein Haufen Arbeit. Doch böte eine solche Technik bereits einiges an Erleichterung.


hey, ist ja toll, dass sowas jetzt auch in wikipedia diskutiert werden kann . hätte ich nie für möglich gehalten
zwei sinn-einheiten, die mir besonders aufgefallen sind:
--doing this would probably descend into an unworkable babel unless there was some very clever programming to keep things clear.
--ich vermute also mal, dass es besser ist, die texte in "sinn-einheiten" aufzuteilen, die aus ein bis drei sätzen bestehen können, statt sich strikt an eine aufteilung in sätze zu halten
die beste denkbare lösung wäre sicherlich die aufteilung bis runter zu den einzelnen sinn-atomen (wörtern) . so etwas nennt man parsen . ein parser gliedert ein in irgendeiner hoch-sprache geschriebenes programm zu einem parse-tree, der dann in eine vom computer verstehbare maschinen-sprache übersetzt wird
das als modell genommen, bräuchte man für jede natürliche sprache (chinesisch, deutsch, englisch usw.) einen eigenen browser, der die umgangssprachliche eingabe in eine für alle sprachen geltende struktur überträgt und vice versa
dann kann man alle wikis dieser welt in einem einzigen riesigen datenbaum abspeichern und pflegen (physikalisch kann das natürlich nach der peer to peer methode auf verschiedene server verteilt sein). dann wäre auch google arbeitslos, weil dieser baum der beste natürliche such-algorithmus ist . jeder satz ist eine verlinkung und jedes wort ist ein schlüssel-wort.
hier müsste sich eine arbeits-gruppe bilden, die auf jahre hinaus beschäftigt wäre . eigentlich könnte jeder mitmachen, weil jeder ein umgangssprachlicher experte ist . natürlich würde das den rahmen von wikipedia sprengen . doch sollten unverständnis und widerstand zu gross werden, kann man ja einfach umziehen. --sigi 040826 20:00

Genaugenommen sind homepages wie diese und deren Unterseiten off-topic. Ich habe eine Idee vom Gebrauch eines off-topic Bereichs (einer "Garage", wo hingehört, was man im Haus nicht haben mag, Sperrmüll inclusive) auf Ca'Foscari-wiki: off-topic umrissen. Homepages müssen da auch noch rein, denke ich. Wikis brauchen eine saubere Stadtmitte in der wohlfeil geearbeitet wird und eine Periferie wo geschwatzt und geulkt, gesponnen und gewohnt wird. Homepages liegen an der Grenze zur wikimitte. Ich würde mich jedenfalls freuen, wenn ich hier weiter an Ideen arbeiten dürfte, die zwar nicht enzyklopädischer Natur sind, jedoch die Enzyklopädie wikipedia als medium direkt betreffen und die - falls das multipelsprachige Ross in Trab gerät - zu wertvollen enzyklopädischen Artikeln führen könnten. Sigis Ideen sind wie immer groß. Ich verstehe jetzt was wikiwiki.de: BaumL soll. Du gehst konsequent viel weiter als ich und es scheint mir richtig so. BaumL allerdings ist für 2080, zuvor müssen wir die Sinneinheiten allmählich verkleinern. Das hat einen technischen und einen sozialen Aspekt. Den technischen sind wir dabei zu lösen. Das Erlernen von Sprache, von neuer, global kompatibler Sprache wird dauern. Das Überwinden von Vorbehalten vor allem. MattisManzel 16:12, 28. Aug 2004 (CEST)

die sinneinheiten allmählich zu verkleinern ist doch schon mal ein anfang:
wie ist die haupt-gliederung einer seite?
welche verschiedenen gliederungen sind möglich?
(oder sagen wir mal: erwünscht (das schränkt die zahl etwas ein))
würde gerne mal wissen, von was ihr da konkret ausgeht
ich persönlich neige dazu, eine seite in zwei haupt-teile zu gliedern:
name der seite | seiten-inhalt
der name ist eine nicht mehr zu unterteilende sinn-einheit und wird getrennt vom inhalt abgespeichert
deshalb braucht man nun einen knoten, der name und inhalt verknüpft
der inhalt besteht wiederum aus einem knoten, der das erste haupt-teil und den rest verknüpft
der rest besteht wiederum aus einem knoten, der das zweite haupt-teil und den rest verknüpft
usw. bis alle haupt-teile erfasst sind
nun können sie sowohl gemeinsam als auch getrennt verwaltet werden
das wäre schon mal die haupt-gliederung
bezogen auf diese seite:

  • mehrsprachige kommunikation |kerbel |mattis |kerbel |mattis |sigi |mattis |sigi

jeder dieser einträge (haupt--sinn-einheiten) besitzt einen verwaltungs-knoten, über den seine form (sein aussehen) und seine verknüpfung mit anderen knoten bestimmt werden kann
d.h. die einträge werden als eigenständige einheiten abgespeichert, aber durch den aufruf-namen als einheit präsentiert
eingeklappt kann jede unter-einheit wieder als eigenständige einheit neu verknüpft oder editiert werden
inwieweit entspricht (oder unterscheidet sich) das (von) eurem ansatz?
--sigi 040901 18:00