3NF a Data Vault: není čeho se bát
Občas dostáváme zajímavou otázku: podporuje Datavault Builder 3NF? Odpověď je ano — a takto to funguje.
Občas dostáváme zajímavou otázku od lidí, kteří mají zájem o použití Datavault Builderu: podporuje DWH automatizační nástroj Datavault Builder 3NF? Zajímavá odpověď zní: ano. Aktivně jsme se rozhodli proti 3NF jádru, protože věříme, že rozdělení dat do jednotlivých funkcí jako klíče (huby), vztahy (linky) a kontext/atributy (satelity) řeší mnoho problémů s 3NF DWH. To zahrnuje vytváření modelů, které lze nyní vytvářet z různých výchozích bodů a snadno spojovat dohromady, dále jednodušší údržbu při změnách modelu a také nezávislost jednotlivých načítacích cest. A to jsou jen tři z mnoha výhod. Obvykle se proto ptáme, co je byznysovým požadavkem pro použití 3NF. Většinu odpovědí lze shrnout tak, že konzumenti dat byli zvyklí na 3NF jádro a nejsou si jisti, zda zvládnou i dotazy z Data Vault modelu.
Použijte rozhraní
Toto je okamžik jasně zdůraznit: nikdo by neměl dotazovat jádro přímo. Podle mého názoru to neplatilo už pro Inmonovy modely a ještě explicitněji to platí pro Data Vault jádra. Pro dotazy musí být zjevně vytvořena rozhraní. Ta převádějí data do formátu optimalizovaného pro dotazy a reporty. Velmi často jsou tato rozhraní vytvářena jako dimenzionální model, protože mnoho moderních reportingových nástrojů je pro něj optimalizováno. Jelikož však máme v Data Vaultu vyšší úroveň normalizace, můžeme poskytovat rozhraní i na jemnější úrovni, jako je 3NF.
Jak vytvořit 3NF vrstvu
Pokud jste v modelování data vaultu zachytili očekávané kardinality (jeden-k-mnoha, mnoho-k-mnoha atd.), máte dokonce všechny informace pro deterministický překlad data vault modelu do 3NF rozhraní:
-
Byznysový klíč nebo hash hubu se přiřadí jako PK
-
Všechny byznysové klíče/hashe hubů spojené jako mnoho-k-jednomu nebo jeden-k-jednomu se stávají cizími klíči
-
Všechna pole ze satelitů se stávají atributy
Zda tohle vytvoříte jako As-of-Now nebo As-of-Then pohled, nezáleží. Můžete jednoduše projít seznam hubů a vytvořit 3NF pohled na každý hub bez jakéhokoli vstupu od uživatele. Pokud nyní v Data Vaultu přidáte satelit, stačí pohled pro daný hub jednoduše regenerovat. Snadno vytvořit, snadno upravit. Jelikož v Datavault Builderu nabízíme API pro všechny funkce, je snadné je použít k plně automatickému vytváření rozhraní podle vlastních pravidel. Teoreticky se konzumenti dat nikdy nedozví, že jejich data jsou uložena ve formátu Data Vault.
Data Vault a 3NF?
Naše odpověď tedy zní: ano, 3NF pro prezentaci dat podporujeme, ale pro jejich uložení vždy používejte Data Vault. To by mohlo být sdělení k přesvědčení i konzumentů dat, kteří chtějí jistotu, že mohou pokračovat v práci se stávajícími přístupy. A pokud to nepomůže, mohli byste jim dokonce zatajit, jak svůj sklad organizujete. Nakonec, když jdeme nakupovat, neprocházíme skladem obchodního centra, ale radujeme se z dobře zásobených regálů.
Vyzkoušejte Datavault Builder v akci
Živé demo. Upřímné odpovědi, zda je to pro váš tým.
Rezervovat bezplatné demo