- AutorIn
- Wolfgang Lehner Technische Universität Dresden, Fakultät Informatik, Institut für Systemarchitektur, Professur für Datenbanken
- Maik ThieleTechnische Universität Dresden, Fakultät Informatik, Institut für Systemarchitektur, Professur für Datenbanken
- Tim KieferTechnische Universität Dresden, Fakultät Informatik, Institut für Systemarchitektur, Professur für Datenbanken
- Titel
- Cardinality estimation in ETL processes
- Zitierfähige Url:
- https://nbn-resolving.org/urn:nbn:de:bsz:14-qucosa2-767565
- Konferenz
- CKIM ´09: Conference on Information and Knowledge Management. Hong Kong, China, 6. November 2009
- Quellenangabe
- DOLAP '09: Proceedings of the ACM twelfth international workshop on Data warehousing and OLAP : CIKM '09: Conference on Information and Knowledge Management
Herausgeber: Association for Computing Machinery
Erscheinungsort: New York, NY
Verlag: ACM
Erscheinungsjahr: 2009
Seiten: 57-64
ISBN: 978-1-60558-801-8 - Erstveröffentlichung
- 2009
- Abstract (EN)
- The cardinality estimation in ETL processes is particularly difficult. Aside from the well-known SQL operators, which are also used in ETL processes, there are a variety of operators without exact counterparts in the relational world. In addition to those, we find operators that support very specific data integration aspects. For such operators, there are no well-examined statistic approaches for cardinality estimations. Therefore, we propose a black-box approach and estimate the cardinality using a set of statistic models for each operator. We discuss different model granularities and develop an adaptive cardinality estimation framework for ETL processes. We map the abstract model operators to specific statistic learning approaches (regression, decision trees, support vector machines, etc.) and evaluate our cardinality estimations in an extensive experimental study.
- Andere Ausgabe
- Link zum Artikel, der zuerst in der ACM Digital Library erschienen ist.
DOI: 10.1145/1651291.1651302 - Freie Schlagwörter (DE)
- Datenbankmanagement, Kardinalitätsschätzung, Data Warehouse, Extrahieren, ETL-Prozess (Extrahieren, Transformieren, Laden)
- Freie Schlagwörter (EN)
- Database Management, Cardinality Estimation, Data Warehouse, Extract, Transform, ETL-Prozess (Extract, Transform, Load)
- Klassifikation (DDC)
- 004
- Verlag
- ACM, New York, NY
- Version / Begutachtungsstatus
- angenommene Version / Postprint / Autorenversion
- URN Qucosa
- urn:nbn:de:bsz:14-qucosa2-767565
- Veröffentlichungsdatum Qucosa
- 22.04.2022
- Dokumenttyp
- Konferenzbeitrag
- Sprache des Dokumentes
- Englisch
- Lizenz / Rechtehinweis