Databaseprogrammer i en Big data Miljø

Big data er ved at blive et vigtigt element i den måde organisationer udnytte store mængder data på den rigtige hastighed til at løse specifikke data problemer. Relational Database Management Systems er vigtige for denne høj lydstyrke. Big data lever ikke i isolation. For at være effektiv, virksomhederne ofte nødt til at være i stand til at kombinere resultaterne af store dataanalyse med de data, der findes i virksomheden.

Big data basics: RDBMS og vedvarende data

Et af de vigtigste tjenester, som operationelle databaser (også kaldet datalagre) er vedholdenhed. Persistens garanterer, at de data, der er lagret i en database, der ikke vil blive ændret uden tilladelse, og at det vil findes, så længe det er vigtigt for virksomheden. Hvad godt er en database, hvis den ikke kan have tillid til at beskytte de data, du lægger i det?

I betragtning af denne vigtigste krav, skal du så tænke over, hvad slags data, du vil vare ved, hvordan kan du få adgang til og opdatere den, og hvordan kan du bruge det til at træffe forretningsmæssige beslutninger. På dette mest grundlæggende niveau, valget af din database motorer er afgørende for din samlede succes med din store implementering data.

Selvom den underliggende teknologi har eksisteret i temmelig lang tid, mange af disse systemer er i drift i dag, fordi de virksomheder, de støtter er meget afhængige af dataene. At erstatte dem ville være beslægtet med skiftende motorer af en flyvemaskine, en transoceanic flyvning.

Big data basics: RDBMS og tabeller

Relationelle databaser er bygget på en eller flere relationer og er repræsenteret ved bordene. Disse tabeller er defineret ved deres søjler, og data er gemt i rækkerne. Den primære nøgle er ofte den første kolonne i tabellen. Konsistensen af ​​databasen og meget af sin værdi opnås ved "normalisere" dataene. Normaliserede data er blevet konverteret fra oprindelige format til en delt, aftalt format.

For eksempel i en database, du måtte have "telefon" som XXX-XXX-XXXX mens en anden kan det være XXXXXXXXX. For at opnå en ensartet baggrund af de oplysninger, vil feltet skal normaliseret til en anden form. Fem niveauer af standarder findes for normalisering. Valget af normale form er ofte henvist til databasen designer. Samlingen af tabeller, nøgler, elementer, og så videre er kendt som databaseskemaet.

I årenes løb har Structured Query Language (SQL) udviklet sig i låsen takt med RDBMS teknologi og er den mest udbredte mekanisme til at oprette, forespørge, vedligeholdelse og drift relationsdatabaser.

I selskaber, både små og store, er de fleste af deres vigtige operationelle oplysninger sandsynligvis gemt i databaseprogrammer. Mange virksomheder har forskellige databaseprogrammer for forskellige områder af deres forretning. Transaktionsdata kan være gemt i én leverandør database, mens kunden oplysninger kan lagres i en anden.

Det er ikke sandsynligt, du vil bruge databaseprogrammer til kernen i gennemførelsen, men du bliver nødt til at stole på de data, der er lagret i databaseprogrammer til at skabe det højeste niveau af værdi for virksomheden med store data.

PostgreSQL, et open source relationel database

Under dit store implementering data, vil du sandsynligvis komme på tværs af PostgreSQL, en udbredt, open source relationel database. Flere faktorer bidrager til populariteten af ​​PostgreSQL. Som en RDBMS med understøttelse af SQL-standarden, det gør alle de ting, man kan forvente i en database produkt, plus dens levetid og bred anvendelse har gjort det "kamp testet." Det er også tilgængelig på næsten alle forskellige operativsystem, fra pc'er til mainframes.

Forudsat det grundlæggende og gøre det pålideligt er kun en del af historien. PostgreSQL understøtter også mange funktioner kun findes i dyre proprietære databaseprogrammer, herunder følgende:

  • Mulighed for at direkte at håndtere "objekter" i den relationelle skema
  • Fremmede nøgler (henvisninger nøgler fra en tabel i en anden)
  • Triggers (arrangementer, der anvendes til automatisk at starte en lagret procedure)
  • Komplekse forespørgsler (underforespørgsler og slutter på tværs diskrete tabeller)
  • Transactional integritet
  • Multiversion concurrency kontrol

Den reelle magt i PostgreSQL er dens udvidelsesmuligheder. Brugere og database programmører kan tilføje nye funktioner uden at påvirke den grundlæggende drift eller pålideligheden af ​​databasen. Mulige udvidelser omfatter

  • Datatyper
  • Operatører
  • Funktioner
  • Indekseringsmetoder
  • Proceduremæssige sprog

Dette høje niveau af tilpasning gør PostgreSQL ønskeligt, når stive, proprietære produkter ikke vil få arbejdet gjort. Det er uendeligt Extensible.

Endelig PostgreSQL licens tillader modifikation og distribution i nogen form, åben eller lukket kilde. Alle ændringer kan holdes privat eller deles med fællesskabet, som du ønsker.


© 2019 Zajacperrone.com | Contact us: webmaster# zajacperrone.com