Ontwerpen van de Nieuwe Generatie Datawarehouses


Scheduled EventsEvent outlinesBooksWhitepapersWebinarsArticlesContact UsRick F van der Lans

 

 

[Home][Event outlines][Dutch Presentations][Datawarehouses]

 

 


Ontwerpen van de nieuwe generatie datawarehouses

Doelstellingen

  • Deelnemers een compleet beeld geven van de markt van datawarehousetools (in al zijn verscheidenheid) en criteria aandragen waarmee tools geselecteerd kunnen worden.
  • Deelnemers technieken en vuistregels doceren voor het ontwerpen van de logische en fysieke aspecten van een relationeel datawarehouse.
  • Deelnemers adviseren bij hun keuze van een datawarehouse-architectuur.

Doelgroep

Deze conferentie is van belang voor diegenen die direct of indirect betrokken zijn bij het ontwerpen en ontwikkelen van datawarehouse-databases, waaronder datawarehouse-specialisten, databasebeheerders, databaseontwerpers, technology-planners, consultants, informatieanalisten en systeemanalisten. De twee dagen zijn gericht op gebruikers met middelgrote tot grote computer systemen. Een minimale kennis van relationele databasetechnologie en databaseontwerp wordt verondersteld.

Tijdsduur

2 dagen

Inleiding

De wereld van datawarehousing staat niet stil. Er zijn technologieën beschikbaar gekomen die nieuwe mogelijkheden bieden. Denk hierbij aan datawarehouse appliances, mashups en SOA. Ook de moderne wensen die gebruikers hebben en de eisen die zij stellen, maakt dat warehouse-architecturen anders opgezet moeten worden. Gebruikers willen meer accurate rapporten, ofwel operational BI is in opkomst. Kortom, de wereld van datawarehousing is aan het veranderen. Deze twee-daagse masterclass richt zich op alle nieuwe ontwikkelingen, inzichten, ideeën en technologieën. Een must voor elke datawarehouse-specialist.

Het ontwerpen van een datawarehouse behelst meer dan alleen het bepalen van een databasestructuur. Er moeten diverse soorten tools gekozen worden, waaronder OLAP-tools (On Line Analytical Processing), rapportage-tools, analytic applications, ETL-tools (Extract Transform Load), portals en databaseservers. Daarnaast moet er ook een architectuur gekozen worden: moeten we één groot centraal datawarehouse opzetten, gebruiken we datamarts of kiezen we voor een virtueel datawarehouse? Er moet ook nagedacht worden over integratie met andere systemen, zoals ERP, CRM en websites. Tevens moet er bestudeerd worden hoe er met metadata omgegaan wordt.

De volgende onderwerpen worden uitvoerig behandeld:

  • Jarenlang zijn datawarehouses met een statisch karakter gebouwd. Slechts periodiek (bijvoorbeeld elke week of elke maand) worden nieuwe gegevens aan datawarehouse toegevoegd. Recentelijk beginnen gebruikers echter te vragen om gegevens die bijna 100% up to date zijn. We spreken dan van realtime of active datawarehouses. Deze nieuwe behoefte heeft grote invloed op welke tools ingezet kunnen en moeten worden en op hoe datawarehouses ontworpen moeten worden. 
  • De oorspronkelijke gebruiker van het datawarehouse is de manager die beslissingen moet nemen. Tegenwoordig zien we ook andere gebruikersgroepen, zoals klanten, toeleveranciers en agenten, die direct toegang krijgen tot het warehouse en analyses willen uitvoeren. Ook zien we niet-menselijke gebruikers, ofwel geautomatiseerde processen, die voorgeprogrammeerde beslissingen nemen. Deze processen vormen ook een nieuwe groep van gebruikers.
  • Het werken met datawarehouses leidt tot data-integratie. Er bestaan ook andere vormen van integratie, waaronder applicatie-integratie. Op dit terrein is de Service Oriented Architecture (SOA) sterk in opkomst. Tijdens dit seminar wordt belicht wat de toegevoegde waarde is van het integreren van de SOA met het datawarehouse.
  • Naast het werken met gestructureerde data, vragen steeds meer gebruikers om ook ongestructureerde data te kunnen analyseren.
  • Nieuwe technologie blijft ontwikkeld worden en vooral op het gebied van databasetechnologie. Er zal onder andere ingegaan worden op datawarehouse-appliances, cubing services, business process engines, streaming database servers en enterprise service bussen.
  • De populaire mashup zal ingezet kunnen worden in een Business Intelligence omgeving om direct externe bronnen te benaderen en externe met interne data te integreren.

Kortom, na het bijwonen van dit seminar, bent u weer volledig bijgepraat over de nieuwste ontwikkelingen op het dynamische gebied van datawarehousing.

Programmaoverzicht

1. Inleiding

  • Overzicht van de status van datawarehousing
  • Introductie terminologie
  • Van statische naar realtime ofwel active datawarehouses

2. Levenscyclus van een datawarehouse-project

  • Bepalen van een implementatiestrategie: top down of bottom up
  • Analyseren van het beslissingsproces
  • Selecteren van een datawarehouse-architectuur: één groot centraal datawarehouse, verscheidene werkgroep warehouses (data marts), of een virtueel datawarehouse?
  • Kan Extreme Programming ingezet worden bij datawarehouse-projecten?
  • Van klassieke datawarehouse architectuur naar virtuele warehouse architectuur, ofwel de opkomst van het Information Delivery Platform.

3. Selecteren van BI-tools

  • Zes groepen BI-tools: executive reporting, managed query, OLAP, data mining, BAM en spreadsheets
  • De terugkeer van executive reporting met tools van o.a. Business Objects (SAP), Cognos (IBM), Information Builders, Hyperion (Oracle), Microsoft en SAS
  • Marktoverzicht van OLAP-tools
  • De opkomst van analytic applications; ofwel "BI out-of-the-box"
  • De rol van de Enterprise Information Portal in een datawarehouse
  • Zijn open source oplossingen volwassen?
  • De mashup als alternatief voor BI-tool

4. Selecteren van databaseservers

  • Hoe geschikt zijn relationele databaseservers, waaronder DB2, Informix, Netezza, Oracle, SQL Server, Sybase en Teradata?
  • Markt van datawarehouse-appliances, waaronder die van DATAllegro (Microsoft), Dataupia, Greenplum, HP, Kickfire, Netezza, Teradata en Sun
  • Overzicht van OLAP-technologie geïmplementeerd in relationele databaseservers, zoals DB2, Oracle11g en SQL Server
  • Speciale databasetalen en interfaces: MDX, XML for Analysis en OLE DB for OLAP
  • De opkomst van open source databaseservers
  • OLAP- en datamining-functionaliteit in een relationele databaseserver

5. Logisch ontwerp van datawarehouses

  • Verhogen van de flexibiliteit van een informatiemodel
  • De vraag- versus de aanbod-gedreven analyse-aanpak
  • Omgaan met feiten en dimensionale gegevens
  • Modelleren van historische gegevens: van statische naar dynamische databases
  • Zijn star schema- en snowflake-ontwerpen wel geschikt voor operational BI?
  • Ontwerpen vanuit universele gegevensmodellen
  • Wat is de toegevoegde waarde van Data Vault?

6. Fysiek ontwerp van datawarehouses

  • Normalisatie of denormalisatie?
  • Introduceren van kunstmatige sleutels (surrogaten) - uniek binnen de database
  • Hoe om te gaan met afgeleide ofwel geaggregeerde gegevens?

7. De kwaliteit van gegevens

  • Hoe en waar dienen gegevens te worden opgeschoond?
  • Hoe goed zijn data-profiling tools voor het signaleren van vervuilde gegevens?
  • Overzicht van de markt van data-profiling tools
  • Verschillen tussen data-cleaning- en data-profiling tools
  • Mogelijkheden en onmogelijkheden van data-cleaning tools

8. Kopiëren van gegevens - van ETL naar SOA

  • XML als taal om gegevens te kopiëren
  • Marktoverzicht van ETL tools, inclusief die van Ab Initio, Business Objects (SAP), Cognos (IBM), Informatica, iWay, Microsoft, Oracle en SAS
  • Wat zijn datamart generatoren, zoals BI-Ready en Kalido?
  • Aspecten van kopiëren: extraheren, verplaatsen, filteren, opschonen, consolideren en laden
  • Het synchroniseren van het centrale datawarehouse en de data marts
  • ETL versus SOA, wanneer dient welk tool ingezet te worden?
  • Webservices voor het binnenhalen van externe gegevens

9. Metagegevens en Master Data Management

  • Het belang van metagegevens voor gebruikers
  • Het verschil tussen technische en bedrijfsmatige metagegevens
  • De opkomst van operationele metadata
  • Wat is een Master Data Management systeem?
  • Tools voor MDM, waaronder die van IBM, Kalido, Oracle en SAP

10. Samenvatting en de toekomst

  • Werken met ongestructureerde gegevens: datamining op en analyses van tekst en beeld
  • Webservices voor het importeren van externe gegevens
  • Datawarehouses als informatiebron voor de buitenwereld

[Previous][Up][Next]

Copyright (c) 2017 R20/Consultancy B.V.. All rights reserved.