Metadane dotyczą rzeczywistych danych oraz ich lokalizacji. Zarządzanie metadanymi polega na administrowaniu danymi opisującymi inne dane. Wymaga to tworzenia polityk i procesów, które zapewnią możliwie najlepszą integrację, dostęp, współdzielenie, analizę, linkowanie oraz zarządzanie informacjami w całej organizacji.
Metadane są generowane za każdym razem, gdy dane są tworzone, pozyskiwane, dodawane, usuwane lub aktualizowane. Na przykład metadane dokumentu w edytorze Microsoft Word obejmują rozmiar pliku, datę utworzenia dokumentu, imię i nazwisko autora i najnowszy modyfikator, daty wszystkich zmian oraz całkowity czas edycji. Można dodawać kolejne metadane, w tym tytuł, znaczniki i komentarze.
Zarządzanie metadanymi ma na celu ułatwianie osobie lub aplikacji zlokalizowania określonego zasobu danych. Wymaga to zaprojektowania repozytorium metadanych (data lake), zapełnienia go oraz ułatwienia korzystania z informacji znajdujących się w repozytorium.
Korzyści z zarządzania metadanymi:
- Spójność definicji metadanych, dzięki czemu zróżnicowana terminologia nie powoduje problemów z odzyskiwaniem danych.
- Większa spójność wielu instancji danych, ponieważ dane mogą być ponownie właściwie wykorzystywane.
- Zarządzanie i utrzymywanie informacji w całej organizacji, niezależnie od wiedzy konkretnego pracownika.
- Większa wydajność, prowadząca do szybszego dostarczania produktów i projektów.
Kiedy organizacja tworzy zasady zarządzania metadanymi, ważne jest, aby menedżerowie wspólnie uzgadniali jeden słownik danych i taksonomię. Należy przy tym uwzględniać różnice między poszczególnymi działami oraz wyeliminować lub zastąpić niestandardowe zastosowania.
http://branden.biz/index.php/2017/03/31/jak-analityk-wspomaga-biznes/
W niektórych przypadkach organizacja może korzystać z gotowych repozytoriów metadanych (data lakes), które są dostarczane wraz z zestawem narzędzi.