Kas yra „Amazon Redshift Data Warehouse System Architecture“?

Kas Yra Amazon Redshift Data Warehouse System Architecture



Duomenų priegloba ir tvarkymas duomenų bazėse ir duomenų saugyklose visada buvo įtempta ir varginanti užduotis. Norint suprasti duomenis, reikia daug išteklių ir skaičiavimo galios. Šiuo tikslu „Amazon Web Services“ turi vieno langelio sprendimą. Ji turi paslaugą „Amazon Redshift“, kuri visiškai valdo vartotojų duomenų saugyklas.

Šiame straipsnyje bus išsamiai paaiškinta „Amazon Redshift“ ir jos duomenų saugyklos architektūra. Visi Redshift duomenų saugyklos sistemos architektūros komponentai bus išsamiai paaiškinti.







Kas yra Amazon Redshift?

IT yra „Amazon“ teikiama duomenų saugojimo paslauga. Jis efektyviai valdo ir analizuoja didelius duomenų rinkinius, skirtus analizei ir ataskaitoms teikti. Jis pastatytas ant stulpelio laikymo modelio. Jis naudoja skaičiavimo mazgų grupes, kurias valdo pagrindinis mazgas, kad užtikrintų didelio našumo duomenų apdorojimą.



Tam reikia duomenų iš skirtingų šaltinių ir sujungia juos, kad būtų sukurta duomenų saugykla. Ji siūlo įvairias funkcijas, tokias kaip duomenų bendrinimas ir realiojo laiko analizė. Norėdami suprasti „Amazon Redshift“ funkcijas ir galimybes, žiūrėkite toliau pateiktą paveikslėlį:







Dabar pereikime prie jo duomenų saugyklos sistemos architektūros.

Kas yra „Amazon Redshift Data Warehouse System Architecture“?

Šią sistemos architektūrą sudaro trys pagrindinės dalys. Šios dalys yra:



  • Sandėliavimas
  • Pagreitis
  • Skaičiavimas

Supraskime jų tikslus:

Sandėliavimas
Saugojimo dalis susijusi su saugojimo paslaugomis, kurias teikia Redshift. Jis turi savo valdomos saugojimo paslaugos parinktį, taip pat S3 kibiro parinktį.

Pagreitis
Pagreičio dalis priklauso nuo naudojamos saugojimo paslaugos ir naudojamos skaičiavimo galios. Redshift valdoma saugykla yra greitesnė, palyginti su kitomis saugojimo parinktimis

Skaičiavimas
Skaičiavimo dalis vien tik susijusi su naudojama skaičiavimo galia. Skaičiavimas atliekamas su klasteriais, o klasteriai turi mazgus. Mazgai savo ruožtu turi skilteles.

Norėdami geriau suprasti visus šios architektūros elementus ir komponentus, žiūrėkite toliau pateiktą paveikslėlį:

Leiskite mums suprasti jo komponentus po vieną.

Kokie yra Amazon Redshift architektūriniai komponentai?

Toliau pateikiami „Amazon Redshift“ architektūriniai komponentai:

  • Klasteriai
  • Mazgai
  • Mazgo skiltelės
  • Sandėliavimas
  • Vidinis tinklas
  • Duomenų bazės

Aptarkime šiuos dalykus po vieną:

Klasteriai
Klasteris yra pagrindinis ir pagrindinis vienetas. Jį sudaro keletas mazgų. Jei klasterį sudaro keli skaičiavimo mazgai, papildomas pagrindinis mazgas koordinuoja šių skaičiavimo mazgų veiklą ir valdo išorinį ryšį.

Mazgai

Klasterių mazgai yra dviejų tipų. Šitie yra:

  • Lyderio mazgas
  • Skaičiavimo mazgas

Supraskime šiuos dalykus po vieną:

Lyderio mazgas
Jis valdo ryšį su klientų programomis ir koordinuoja sąveiką su skaičiavimo mazgais. Vadovaujantis mazgas atlieka gyvybiškai svarbų vaidmenį vykdant sudėtingas užklausas. Jis sukompiliuoja kodą pagal vykdymo planą, kuris paskirstomas skaičiavimo mazgams, ir priskiria duomenų dalis kiekvienam atskiram skaičiavimo mazgui.

Apskaičiavimo mazgas
Skaičiavimo mazgai yra „Amazon Redshift“ architektūros pagrindas. Jie saugo ir apdoroja duomenis. Jie turi tam skirtus išteklius, tokius kaip atmintis ir centrinis procesorius.

Mazgo skiltelės
Skaičiavimo mazgai toliau skirstomi į dalis. Šios dalys veikia kartu, kad apdorotų priskirtus darbo krūvius ir pasiektų lygiagretumą, kad pagerintų užklausų apdorojimą.

Sandėliavimas
Duomenų saugojimą „Amazon Redshift“ valdo „Redshift Managed Storage (RMS)“. Jis turi galimybę savarankiškai padidinti saugyklos mastelį naudojant „Amazon S3“ saugyklą. RMS naudoja didelio našumo SSD pagrįstą vietinę saugyklą kaip 1 pakopos talpyklą, kuri optimizuoja našumą.

Vidinis tinklas
Šis vidinis „Amazon Redshift“ tinklas padeda greitai ir saugiai bendrauti tarp lyderio mazgų ir skaičiavimo mazgų. Šis tinklas nėra tiesiogiai pasiekiamas kliento programoms.

Duomenų bazės
Klasteriai turi vieną ar daugiau duomenų bazių. Duomenys iš šių duomenų bazių yra skaičiavimo mazguose. Klientų programos bendrauja su lyderio mazgu. Apskaičiavimo mazgas valdo užklausų vykdymą skaičiavimo mazguose.

Tai viskas apie „Amazon Redshift“ ir jo architektūrinius elementus. Šiame straipsnyje išsamiai paaiškinti „Amazon Redshift“ komponentai

Išvada

„Amazon Redshift“ architektūra yra priežastis, dėl kurios remiasi jos galimybės. Pagrindinis mazgas valdo ir tvarko skaičiavimo mazgus, o mazgų skiltys padeda lygiagrečiai apdoroti. „Redshift Managed Storage“ naudoja SSD pagrįstą saugyklą, kad pagerintų našumą. Šiame straipsnyje paaiškinta „Amazon Redshift“ duomenų saugyklos sistemos architektūra.