Diskussion:ETL-Prozess/Archiv/1

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Unverständlich!

Worum geht es in diesem Artikel? Betriebswirtschaft? Informationswissenschaften? Datenbanktheorie? Die Verweise führen nur zu anderen Prozessen, die ebenfalls nicht erklären, in welchen Zusammenhang das ganze hier steht. Dieser Artikel ist so nicht verständlich. Der Begriff muß in einen allgemeinverständlichen Kontext gebracht werden: Wikipedia:Wie schreibe ich gute Artikel#Verständlichkeit

ETL ist auch kein normaler Prozess, wie der Einkauf eines Brötchens (obwohl man diesen auch verkomplizieren könnte (Abstraktionsprinzip)).
Wenn man sich ein wenig in der Materie Data Warehouse usw. auskennt, ist der Artikel verständlich. Hat man allerdings von diesen Themen noch nichts gehöhrt, ist das Unwissen über ETL auch kein Beinbruch! -- (von unbekannt)


Ich habe die Einleitung etwas ueberarbeitet, ich hoffe es ist jetzt besser? -- sparti 18:38, 4. Nov. 2006 (CET)

Data Profiling

Tzeh: das Profling findt in aller Regel im Quellsystem statt. Also vor/während der Extraktion. Die Transformation (das Etl mapping) sollte möglichst ohne Regeln zu Ändern der Datenqualität bleiben, weil diese sonst in den testprozess einfliessen müssen. Viele Grüße Alex 18:36, 16. Mär. 2008 (CET)

Hallo Alex, ich frage mich (und Dich), ob das Data Profiling überhaupt etwas mit dem ETL-Prozess zu tun hat, da es in den Quellsystemen stattfindet. Es hat lediglich den Zweck, Aussagen über das Quellsystem zu machen, insbesondere über dessen Datenqualität. Somit liegt es zeitlich v o r dem ETL-Prozess.
Ich schlage daher Folgendes vor:
1. Den Passus über Data Profiling aus dem vorliegenden Artikel zu entfernen
2. Einen separaten Artikel über Data Profiling zu erstellen
(siehe hierzu auch den Artikel über Data Profiling in der englischen Wikipedia)
3. Im Artikel über Data Profiling auf die v o r bereitenden Maßnahmen für den ETL-Prozess hinzuweisen wie auch auf den Umstand, dass einige ETL-Werkzeuge das Data Profiling unterstützen.
Ich grüße Dich freundlich tzeh 12:39, 17. Mär. 2008 (CET)

Hi, das ist leider auch nur die halbe Wahrheit. Data Profiling und Data Cleansing gehören zusammen. DP findet vor dem DC statt, um den Bedarf zu klären. Außerdem findet es nach dem DC statt um den Erfolg zu prüfen. Bezogen auf den ETL Prozess kannst Du DC im Quellsystem, Unterwegs und im Zielsystem machen. Natürlich sollte es möglichst im Quellsystem bleiben, um die Komplexität der Transformation zu reduzieren. Daher sind aus meiner Sicht ETL und DQ (DP/DC) shcon serh stark verwoben. Ob ein eigener Artikel dem gerecht wird...? Man könnte es hier kurz anreisen und dann noch einen ausführlcihen Artikel zu DP anstreben. Aber wenn wir derzeit nur 2 Sätze zu DP spendieren, dann lohnt sich das auslagern nicht wirklich, oder?
Viele Grüße Alex 13:35, 18. Mär. 2008 (CET)

fragwürdige Grafik zur Veranschaulichung des ETL-Prozesses

JakobVoss hat eine Grafik zur Veranschaulichung des ETL-Prozesses eingefügt. Ich fürchte nur, dass sie wegen der verwendeten Symbole eher verwirren als klären. Welcher Mehrwert soll denn in der Grafik stecken, Jakob? Ich grüße alle konstruktiven Mitstreiter freundlich. tzeh 19:43, 9. Apr. 2009 (CEST)

Naja, sehr schematisch ist sie schon. Aus meiner Sicht wäre es hilfreich, das etwas genauer zu zeigen. Also Staging und Transformation area, dass Eingangs und Ausgangsfilter angewendet werden, usw. Alex 08:37, 10. Apr. 2009 (CEST)
Was soll denn der an Tattoos erinnernde Schnörkel zwischen den beiden Datentöpfen? Soll er etwa die verschlungenen Transformationspfade assoziieren? Ich werde versuchen, eine Grafik zu erstellen, die den ETL-Prozess genauer und verständlicher beschreibt. tzeh 11:29, 10. Apr. 2009 (CE
Guter Plan. Danke Alex 21:47, 10. Apr. 2009 (CEST)
Ist hübsch geworden. Danke! Alex 20:20, 29. Apr. 2009 (CEST)
Hallo Alex, kannst Du bitte das jpg-File in ein für derartige Grafiken vorgeschriebenes svg-File wandeln? Mir fehlen dazu die Kenntnisse bzw. die Werkzeuge. Dank im voraus und herzlichen Gruß Thomas tzeh 20:53, 1. Mai 2009 (CEST)

Geschlecht in 'Anpassung von Datenwerten' unter 'Tranformation'

Wäre es möglich, das Beispiel 'Geschlecht' in der Anpassung von Datenwerten anders zu handhaben oder ein anderes Beispiel zu wählen? Ich bin hier nur 'vorbeigekommen', um mich über den Prozess zu informieren, aber dieses Beispiel stört mich ziemlich, da es sehr Geschlechtsbinär ist. Mehr zu dem Thema: http://en.wikipedia.org/wiki/Gender_binary (nicht signierter Beitrag von 79.205.120.105 (Diskussion) 10:47, 5. Apr. 2011 (CEST))