Wikipedia Diskussion:Einbänder/Stichworte

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 15 Jahren von Neitram in Abschnitt Anzahl?
Zur Navigation springen Zur Suche springen

erste Version[Quelltext bearbeiten]

Brauche Hilfe bei der Regex für Umwandlung von Förster, Hans in Hans Förster. Diese Sonderzeichen müssen noch ersetzt werden: ć, ı, ş, ş, ō. Grüße, Conny 20:03, 16. Sep. 2008 (CEST).Beantworten

Von Regex verstehe ich nichts, aber ich fände es gut, wenn die Lemmata als blaue Links im Wortlaut des Einbänders erscheinen, also so: Presley, Elvis. Neitram 09:00, 17. Sep. 2008 (CEST)Beantworten
Find ich auch gut. Conny 19:58, 17. Sep. 2008 (CEST).Beantworten
Und wie kann man diese Stichwortliste bearbeiten? --Schlesinger schreib! 20:23, 17. Sep. 2008 (CEST) Schon, hab's selber rausgefunden. --Schlesinger schreib! 20:31, 17. Sep. 2008 (CEST)Beantworten
RegExp erledigt. Dass mit dem Wunsch nach Sortierung gemäß Einbänders hab ich zuspät gelesen. Kann dies aber auf Wunsch noch morgen korrigieren. Grüße —DerHexer (Disk.Bew.) 02:17, 18. Sep. 2008 (CEST)Beantworten
Danke für die viel Zeitersparnis bringende Arbeit. Grüße, Conny 02:35, 18. Sep. 2008 (CEST).Beantworten
Bin grade unsicher, ob wir wirklich die Schreibweise wie im Einbänder machen sollten. Zum einen, weil man jetzt nicht weiterarbeiten kann, ohne die Änderungen doppelt zu machen (Version muss erst stehen). Zum anderen, da eine Sortierung nach diesen Lemata ein komplettes Durchgehen der Daten erfordert (würde zur Not gehen). Conny 10:02, 18. Sep. 2008 (CEST).Beantworten
Zu spät … naja, nun hast du beide Versionen, bei denen du dich entscheiden kannst, welche du weiterarbeiten willst. … Ach ja, wenn ich mit den Sonderzeichen nochmal durchgehen soll, kann ich das machen. Da sollten dann aber die restlichen Zeichen noch ergänzt werden. Grüße, —DerHexer (Disk.Bew.) 10:18, 18. Sep. 2008 (CEST)Beantworten
Guten Morgen :) . Ok, welche wollen wir nehmen? Sonderzeiche - jap. Conny 10:22, 18. Sep. 2008 (CEST).Beantworten
Ich finde es so gut und würde einfach jetzt weiter an der Form arbeiten. Conny 10:33, 18. Sep. 2008 (CEST).Beantworten

Sonderzeichenzuweisung[Quelltext bearbeiten]

  • á á
  • ă
  • ć ć
  • é é
  • è è
  • í í
  • ı
  • Ł Ł; ł ł
  • ó ó
  • œ œ
  • ō o
  • ř ř
  • ş ş
  • ţ
  • ú ú
  • Ž Ž; ž ž
  • Ż Ż; ż ż
  • ğ ğ
  • ’ ’

Ärgerlich[Quelltext bearbeiten]

Conny und ich haben offenbar gleichzeitig die erste Seite abgearbeitet. Das waren für mich 30 Minuten vergebliche Arbeit. Nun gut, Pech gehabt und gute Nacht. --Schlesinger schreib! 23:45, 17. Sep. 2008 (CEST)Beantworten

Das tut mir sehr leid. Bitte „inuse“ Liste jetzt untenstehend verwenden. Schlaf gut, Conny 01:37, 18. Sep. 2008 (CEST).Beantworten

Sortierung[Quelltext bearbeiten]

Artikel sind dato nach Wikipedialemma sortiert. Conny 00:28, 18. Sep. 2008 (CEST).Beantworten

Arbeitsstand Verweisanpassung[Quelltext bearbeiten]

Anzahl?[Quelltext bearbeiten]

Könnte jemand eventuell schon mal die genaue Anzahl Stichwörter zählen? Neitram 16:01, 18. Sep. 2008 (CEST)Beantworten

Ich komme bei den Original TXTs auf 19634 19623, Zahl ist aber mit Vorsicht zu genießen. Die Anzahl, der hier vorhandenen müsste man zum Schluss zählen, das geht recht genau. Conny 00:51, 19. Sep. 2008 (CEST).Beantworten
Danke! Ist das einschließlich oder ausschließlich Verweisstichwörtern? Neitram 10:33, 19. Sep. 2008 (CEST)Beantworten
Aus meiner Sicht einschließlich :I . Aber gemäß Definition sollten es 50.000 sein - hab ich da was übersehen? Conny 12:01, 19. Sep. 2008 (CEST).Beantworten
Ja, die Trickformulierung "50.000 Stichwörter und erklärte Begriffe". Mit "erklärte Begriffe" meint Bertelsmann offenbar irgendwelche Begriffe, die im Fließtext des Lexikons (kursiv gesetzt?) vorkommen. Neitram 13:19, 19. Sep. 2008 (CEST)Beantworten
Trickformulierung ist ein unschönes Wort. Wenn ich mir den Eintrag zur Lausitz ansehe, so lese ich dort Lausitz, Niederlausitz, Oberlausitz, Lausitzer Gebirge, Lausitzer Neiße, sowie Spreewald und Zittau Gebirge. Macht 5+2 Begriffe unter einem Stichwort. Geht also. --32X 13:00, 24. Sep. 2008 (CEST)Beantworten
Nun, dass alle diese Begriffe unter "Lausitz" erwähnt werden, macht sie nicht zu eigenen Stichwörtern im lexikografischen Sinne (siehe Lemma (Lexikografie)). Eine "Trickformulierung" (im Unterschied zu einer Lüge oder Falschangabe) ist es in dem Sinne, dass die Formulierung tatsächlich nicht behauptet, dass es 50.000 Stichwörter wären, auch wenn geschätzte 99% der Leute (einschließlich der Presse und Insidern wie M. Schindler in der Ankündigung des Projekts) das seit April 2008 in diesem Sinne missverstanden haben und zu einem guten Teil noch heute missverstehen und auf diese Weise eine Fehlinformation verbreiten. Neitram 15:44, 25. Sep. 2008 (CEST)Beantworten
In den 19634 müssten somit gemäß meiner Zählung 363 Verweise dabei sein. Conny 12:05, 19. Sep. 2008 (CEST).Beantworten
Das heißt, es bleiben 19.271 echte Stichwortartikel ohne die Verweise. Neitram 13:19, 19. Sep. 2008 (CEST)Beantworten
Ich kann derzeit nicht nachvollziehen, ob ich richtig ausgewertet habe. Zahl bitte mit Vorsicht genießen ;) . Conny 13:28, 19. Sep. 2008 (CEST).Beantworten
Okay, ich werde sie bis zu einem gesicherten Auszählergebnis als vorläufig betrachten und nicht im normalen Namensraum verwenden. Aber falls sie stimmt, ist die Angabe "Das vorliegende Lexikon enthält 50.000 Stichwörter und erklärte Begriffe und mehr als 20.000 Stichwortartikel" (aus dem Vorwort des Einbänders) unzutreffend, selbst dann, wenn man wohlwollenderweise die ca. 363 Verweise als "Stichwortartikel" mitrechnen würde. Neitram 15:44, 25. Sep. 2008 (CEST)Beantworten