Kas yra „Amazon Redshift“ duomenų tipai?

Kas Yra Amazon Redshift Duomenu Tipai



„Amazon Redshift“ yra AWS siūlomas debesies sprendimas, atitinkantis duomenų saugyklos paskirtį. Duomenų saugykla yra didelė erdvė debesyje, kurioje saugomi didžiuliai duomenų kiekiai. Skirtumas tarp duomenų saugyklos ir duomenų bazės yra tas, kad pirmoji saugo ne tik dabartinius duomenis, bet ir visą duomenų istoriją.

Šiame straipsnyje sužinosite apie AWS „Amazon Redshift“ ir duomenų tipus, kuriuos palaiko ši paslauga.







Kas yra „Amazon RedShift“?

Tai duomenų saugyklos debesies sprendimas, pagrįstas „PostgreSQL“ . Tam naudojama technologija, vadinama „Masyviai lygiagretus apdorojimas (MPP)“ žaibo greičiu apdoroti petabaitų duomenų. Tai yra paprastas sprendimas nuspėti realiuoju laiku remiantis istoriniais duomenimis ir srautinio perdavimo sprendimais.



Toliau pateiktame paveikslėlyje parodytas „Amazon Redshift“ veikimo mechanizmas:







Šis grafinis „Amazon Redshift“ veikimo paaiškinimas yra labai paprastas ir aiškus. Ji suteikia mums informacijos apie tai, kaip duomenys gaunami ir toliau apdorojami, kad būtų generuojami išėjimai ir kuriamos duomenimis pagrįstos programos.

„Amazon Redshift“ duomenų saugyklos architektūra taip pat matoma toliau pateiktame paveikslėlyje:



Dabar pereisime prie šios paslaugos naudojimo būdų ir funkcijų.

funkcijos

Kaip jau minėta, „Amazon Redshift“ yra pagrįsta PostgreSQL ir naudoja technologiją, vadinamą Massively Parallel Processing, kuri leidžia greitai apdoroti petabaitus duomenų. Todėl „Redshift“ siūlo daugybę funkcijų ir naudojimo būdų. Kai kurios iš šių funkcijų pateikiamos žemiau:

  • Duomenų saugumas ir šifravimas.
  • Verslo analizė.
  • Duomenimis pagrįstų programų palaikymas.
  • Nuspėjamoji analizė.
  • Automatizuotas užduočių kartojimas.
  • Lygiagretus duomenų mastelio keitimas.
  • Duomenų saugykla.

Kai kurias papildomas šios paslaugos funkcijas galite pamatyti toliau pateiktame paveikslėlyje:

Tai buvo dauguma „Redshift“ siūlomų funkcijų, o dabar pereisime prie šios paslaugos palaikomų duomenų tipų.

Duomenų tipai

„Amazon Redshift“ yra duomenų saugojimo sprendimas su daugybe funkcijų. Jis palaiko ir struktūrizuotus, ir nestruktūrizuotus duomenų tipus. Kadangi jis pagrįstas PostgreSQL, duomenimis galima manipuliuoti naudojant paprastas SQL užklausas.

Dabar kyla kitas klausimas, ty kuo šie duomenų formatai skiriasi vienas nuo kito? Pakalbėkime apie šiuos du duomenų formatus.

Struktūrizuoti duomenys

Labai suformatuotas duomenų tipas, kurį lengvai išverčia mašininio mokymosi algoritmai, vadinamas struktūriniais duomenimis. SQL duomenų bazė veikia su struktūriniais duomenimis. Struktūriniai duomenys pateikiami lentelės pavidalu, pavyzdžiui, duomenys, naudojami reliacinėse duomenų bazėse

Viena iš plačiai naudojamų SQL duomenų bazių valdymo sistemų yra MYSQL. Jo architektūra matoma žemiau pateiktame paveikslėlyje:

Nestruktūruoti duomenys

Nestruktūruoti duomenys yra mažiau šabloniški ir mažiau formatuojami, pavyzdžiui, duomenys, naudojami nesusijusiose duomenų bazėse. „MongoDB“ yra garsi ne reliacinė duomenų bazė. SQL užklausos neveikia nereliacinėse duomenų bazėse, todėl šios duomenų bazės dar vadinamos NoSQL duomenų bazėmis.

Kaip jau minėta, MongoDB yra nestruktūrizuota duomenų bazių valdymo sistema ir jos architektūrą galima pamatyti žemiau pateiktame paveikslėlyje:

Išnagrinėjome du pagrindinius duomenų tipus, naudojamus duomenų bazėse, ir dabar pereisime prie faktinių duomenų tipų, kuriuos palaiko „Amazon Redshift“. Šie duomenų tipai yra:

  • Skaitiniai duomenys
  • Simbolių duomenys
  • Datos ir laiko duomenys
  • Būlio duomenys
  • HLLSKETCH duomenys
  • SUPER duomenys
  • PAKEITIMO Duomenys

Pakalbėkime apie šiuos duomenų tipus:

Skaitiniai duomenys

Šis duomenų tipas yra savaime suprantamas. Jis palaiko sveikųjų skaičių, dešimtainių skaičių, slankiojo kablelio ir kitų skaitmeninių duomenų tipų duomenis.

Sveikojo skaičiaus duomenų tipo charakteristikas galima pamatyti paveikslėlyje žemiau:

Dešimtainis duomenų tipas saugo duomenis pagal vartotojo tikslumą. Jo charakteristikos yra šios:

Simbolių duomenys

CHAR ir VARCHAR duomenų tipai patenka į simboliais pagrįstų duomenų tipų kategoriją. NCHAR ir NVARCHAR taip pat yra simbolių tipo duomenų tipai. Skirtingai nuo CHAR ir VARCHAR, šie du duomenų tipai saugo fiksuoto ilgio unikodo simbolius. Pažvelkime į šių duomenų tipų ypatybes, pavyzdžiui:

  • CHAR, CHARACTER, NCHAR diapazonas yra 4 KB.
  • VARCHAR, NVARCHAR turi 64 KB diapazoną.
  • BPCHAR diapazonas yra 256 baitai.
  • TEXT diapazonas yra 260 baitų.

Datos ir laiko duomenys

Datos ir laiko duomenų tipai yra DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ. Šių duomenų tipų funkcinės galimybės yra šios:

  • DATE tiesiog išsaugo kalendoriaus datas.
  • TIME išsaugo laiką be jokios laiko juostos. Pagal numatytuosius nustatymus tai yra UTC.
  • TIMETZ išsaugo laiką pagal laiko juostą. Pagal numatytuosius nustatymus jis yra UTC tiek vartotojų lentelėse, tiek sistemos lentelėse.
  • TIMESTAMP apima ne tik laiką, bet ir datas. Pagal numatytuosius nustatymus jis yra UTC tiek vartotojų lentelėse, tiek sistemos lentelėse.
  • TIMESTAMPTZ apima ne tik laiką, bet ir datas. Pagal numatytuosius nustatymus jis yra UTC tik vartotojų lentelėse.

Būlio duomenys

Būlio duomenų tipas yra dvejetainis duomenų tipas, o tai reiškia, kad yra tik dvi reikšmės. Būlio duomenų tipo charakteristikų lentelė pateikta žemiau esančiame paveikslėlyje:

HLLSKETCH duomenys

Šis duomenų tipas naudojamas eskizams saugoti. Raudonasis poslinkis gali reikšti eskizus reta arba tankia forma. Eskizai pradedami retai ir palaipsniui tampa tankesni, kai tankus formatas suteikia daugiau veiksmingumo, naudojant nuorodą.

SUPER duomenys

Šis duomenų tipas susijęs su nestruktūriniais duomenimis, kurie gali būti masyvų, įdėtųjų struktūrų arba JSON pavidalu. Duomenų modelio ar formato nėra. Vartotojai gali ieškoti daugiau informacijos naršydami nuorodą.

PAKEITIMO Duomenys

Šis duomenų tipas taip pat saugo simbolius. Tačiau ilgis yra ribotas. „Amazon Redshift“ leidžia perkelti VARBYTE duomenis į bet kokio sveikojo skaičiaus arba simbolio tipo duomenis. Norėdami gauti daugiau informacijos apie šį duomenų tipą, spustelėkite toliau pateiktą nuorodą.

Tai viskas, ką turi „Amazon Redshift“ ir jo palaikomi duomenų tipai.

Išvada

„Amazon Redshift“ yra AWS paslauga, kuri savo pagrindine forma tarnauja kaip duomenų saugykla, tačiau yra labai galingas ir funkcionalus analizės ir prognozavimo sprendimas. Šiame straipsnyje aptariamas raudonasis poslinkis ir jo palaikomi duomenų tipai. Šie duomenų tipai buvo trumpai paaiškinti kartu su jų charakteristikomis.