Big Data en meer. Databases. Wat is het verschil?

Technologie evolueert in een snel tempo en technologieleiders zullen snel merken dat alle niet-gegradueerde technologielessen oud worden. Als je chief technology officer bent bij een groot bedrijf (CTO), heb je niet veel tijd om nieuwe technologieën te leren, omdat je bezig bent met brandbestrijding en er goed uitziet op je volgende bestuursvergadering. u zult het zeker weten. voor iedereen die hetzelfde probeert te doen. Na verloop van tijd kun je je afvragen: wat is het verschil tussen big data en databases?

Elke technologiespecialist weet wat de database is. Het is gewoon een database die met de tijd groeit en interessante dingen leert door middel van peilingen. Er is een concept dat database wordt genoemd, en dit is wat de naam impliceert. Laten we niet ingaan op het "Kimball en Inman" -gesprek en laten we het maar zeggen.

Een repository is een reeks incompatibele databases in een organisatie die kan worden verbonden met een openbare sleutel. We kunnen bijvoorbeeld records in meerdere databases koppelen via een uniek veld genaamd CUSTOMER_ID. Databases in verschillende secties die records bevatten die we willen koppelen met CUSTOMER_ID:

Met CUSTOMER_ID kunt u eenvoudig een lijst met alle onbetaalde facturen op dezelfde pagina afdrukken en de lijst met de 10 meest recente serviceaanvragen die de verkoper naar een verkoopgesprek met hen leiden. Natuurlijk gebruiken we tegenwoordig Salesforce voor dit alles, maar dit eenvoudige voorbeeld geeft inzicht in hoe nuttig het is om verschillende gegevensbronnen met elkaar te verbinden. Databases, behalve wanneer ze doorgaan en enorme gegevens gebruiken om goed geïnformeerde beslissingen te nemen. Bij het bouwen van een database weet u meestal welke vragen u misschien wilt beantwoorden, omdat een persoon op C-niveau u vraagt ​​om uw prestaties (KPI) te meten. Je kunt gewoon geen databases bouwen om ze te maken, omdat het een erg duur bedrijf is. Laten we het nu hebben over "big data" en datawarehouses.

Ten eerste moeten we de term "big data" definiëren, die zichzelf definieert. In de afgelopen twee jaar heb je vaak statistieken gehoord over 98% van de gegevenscreatie. Dit zijn big data. Het is mogelijk om alle geweldige databases te verzamelen die momenteel worden gemaakt (onthoud de gegevenszoekopdracht?). In de hightechwereld van vandaag kunnen we begrijpen wat niet bestaat. Zoals Donald Rumsfeld ze 'onbekende onbekenden' noemt, weten we wat we niet weten. In de psychologie staat dit idee bekend als de Johari-spiegel. Weet je, de verkoper weet niet dat hun aanwezigheid iedereen om zich heen dwingt Petra Pan op de hoogste verdieping te willen hebben? Het feit dat de persoon niet weet hoe vervelend ze zijn en waarom mensen om hen heen er niet met hun vinger op kunnen wijzen, is 'onbekend', omdat niemand weet hoeveel Rob's verkoopactiviteit is. , dikke, schadelijke lul. Blijf in ieder geval doorgaan.

Geplaatst op 7wData.be.