10 geriausių duomenų mokslo knygų ir aprašų, skirtų generalistui, sąrašas

10 Geriausiu Duomenu Mokslo Knygu Ir Aprasu Skirtu Generalistui Sarasas



Duomenų mokslas yra studijų sritis, kuri apdoroja didžiulius duomenų kiekius naudodama mokslinius metodus, procesus, algoritmus ir sistemas, kad surastų nematomus modelius, gautų prasmingą informaciją, priimtų verslo sprendimus įmonėse, taip pat naudotų ne verslo institucijose. Ne verslo institucijos apima sveikatos priežiūros, žaidimų, vaizdo atpažinimo, rekomendacijų sistemų, logistikos, sukčiavimo aptikimo (bankų ir finansų įstaigų), interneto paieškos, kalbos atpažinimo, tikslinės reklamos, oro linijų maršrutų planavimo ir papildytosios realybės pramonės šakas. Duomenų mokslas yra dirbtinio intelekto pogrupis. Analizei naudojami duomenys gali būti gauti iš įvairių šaltinių ir pateikiami įvairiais formatais. Kai kurie šaltinio duomenys gali būti standartizuoti; kiti gali būti nestandartizuoti.

Kitaip tariant, duomenims rinkti naudojamos skirtingos metodikos (daugiskaita). Tada iš surinktų duomenų išgaunamos žinios (vertingos išvados). Proceso metu, surinkus duomenis, atliekamas jų (duomenų) tyrimas, siekiant gauti naujų duomenų (rezultatų), iš kurių sprendžiamos problemos.







Duomenų mokslas kaip (pagrindinė) disciplina egzistuoja universiteto bakalauro ir magistro laipsniais. Tačiau tik keli pasaulio universitetai siūlo duomenų mokslą bakalauro ar magistro laipsnį. Bakalauro laipsniu studentas baigia duomenų mokslo laipsnį. Tai tarsi bendros paskirties laipsnis. Magistro studijų lygmeniu studentas baigia duomenų mokslų magistrantūros studijas, kurios specializuojasi duomenų analizės, duomenų inžinerijos arba duomenų mokslininko pareigose.



Skaitytoją gali nustebinti ir galbūt, deja, tai, kad mašininis mokymasis, modeliavimas, statistika, programavimas ir duomenų bazės yra būtinos žinios norint studijuoti duomenų mokslą bakalauro lygmeniu, nepaisant to, kad jie yra gerbiami universiteto kursai, studijuoti kitos bakalauro ar magistro disciplinos. Nepaisant to, kai studentas eina į universitetą studijuoti duomenų mokslo laipsnio lygiu, visi šie kursai vis tiek bus studijuojami kartu su tinkamais duomenų mokslo kursais arba prieš juos.



Duomenų mokslas bakalauro laipsniui arba jo specializacijos, pvz., duomenų analizė, duomenų inžinerija ar duomenų mokslininkas, vis dar kuriamos; nors jie pasiekė tokį etapą, kad po studijų (universitete) yra taikomi pramonės šakose. Duomenų mokslas apskritai yra gana nauja disciplina.





Atminkite, kad prieš tapdami specialistu pirmiausia turėtumėte būti generalistu. Specialistų programų skirtumai dar nėra aiškūs. Skirtumai tarp generalistinių ir specializuotų programų dar nėra aiškūs.

Kadangi duomenų mokslas yra palyginti nauja disciplina, šiame dokumente aprašytos knygos yra pagrįstos turinio aprėptimi, o ne pedagogika (kaip gerai knygoje mokoma). Ir jie skirti bakalauro (generalistų) programai. Yra įvairių bendrųjų kursų.



Sąrašas

Daugiau informacijos ir galimo pirkimo su kreditine kortele rasite kiekvienos knygos hipersaite. Ne viena iš knygų apima visus generalistinius kursus.

Esminė duomenų mokslo matematika: skaičiavimas, statistika, tikimybių teorija ir tiesinė algebra

Parašė: Hadrien Jean

  • Leidėjas: Hadrien Jean
  • Paskelbimo data: po 2020 m. rugsėjo 30 d
  • Kalba: anglų
  • Puslapių skaičius: daugiau nei 400

Šios knygos turinį galima vertinti kaip duomenų mokslo matematikos kursą. Nors pačiam mokytis duomenų mokslų nerekomenduojama, abiturientams, norinčiam savarankiškai mokytis duomenų mokslų, reikėtų pradėti nuo šios knygos.

Turinys: Skaičiavimas; Statistika ir tikimybė; Tiesinė algebra; skaliarai ir vektoriai; Matricos ir tenzoriai; Apimtis, tiesinė priklausomybė ir erdvės transformacija; Tiesinių lygčių sistemos; Savieji vektoriai ir savosios reikšmės; Vienaskaitos reikšmės skaidymas.

https://www.essentialmathfordatascience.com/

Sveiko proto duomenų struktūrų ir algoritmų vadovas: patobulinkite savo pagrindinius programavimo įgūdžius / 2-asis leidimas

Parašė: Jay Wengrow

  • Leidykla: Pragmatic Bookshelf
  • Paskelbimo data: 2020 m. rugsėjo 15 d
  • Kalba: anglų
  • Matmenys: 7,5 x 1,25 x 9,25 colio
  • Puslapių skaičius: 508

Šioje knygoje aprašomi duomenų moksle naudojami algoritmai ir duomenų struktūros. Darant prielaidą, kad kažkas, baigęs vidurinę mokyklą, pats mokosi duomenų mokslų, tai yra kita knyga, kurią reikia perskaityti perskaičius ankstesnę matematikos knygą. Programų pavyzdžiai pateikiami „JavaScript“, „Python“ ir „Ruby“.

Turinys: Kodėl svarbios duomenų struktūros; Kodėl algoritmai svarbūs; O taip! Didelė O žymėjimas; Paspartinkite kodą naudodami Big O; Kodo optimizavimas su dideliu O ir be jo; Optimizavimas pagal optimistinius scenarijus; Big O kasdieniame kode; Blazing Fast Lookup su maišos lentelėmis; Elegantiško kodo kūrimas su krūvomis ir eilėmis; Rekursyviai pasikartoti su rekursija; Mokymasis rašyti rekursyviai; Dinaminis programavimas; Rekursyviniai greičio algoritmai; Mazgais pagrįstos duomenų struktūros; Visų dalykų paspartinimas naudojant dvejetainius paieškos medžius; Išlaikyti savo prioritetus su kaupu; Pabandyti neskauda; Viską sujungti su grafikais; Susidoroti su erdvės apribojimais; Kodo optimizavimo būdai

Sumanesnis duomenų mokslas: sėkmingi įmonės lygio duomenys ir dirbtinio intelekto projektai / 1 Šv Redagavimas

Parašė: Nealas Fishmanas, Cole'as Strykeris ir Grady Booch

  • Leidėjas: Wiley
  • Paskelbimo data: 2020 m. balandžio 14 d
  • Kalba: anglų
  • Puslapių skaičius: 286

Turinys: kopimas dirbtinio intelekto kopėčiomis; Įrėminta I dalis: AI naudojančių organizacijų svarstymai; II dalis: Apsvarstymai dirbant su duomenimis ir AI; „Analytics“ apžvalga: daugiau nei vienas plaktukas; Žvilgsnis į „Analytics“: ne viskas gali būti vinis; Operatyvinių disciplinų sprendimas dirbtinio intelekto kopėčiose; Maksimalus savo duomenų panaudojimas: vertės valdymas; Duomenų vertinimas atliekant statistinę analizę ir prasmingos prieigos įgalinimas; Ilgalaikis statybos; Kelionės pabaiga: dirbtinio intelekto IA.

Mašininis mokymasis: tikimybinė perspektyva (adaptyviojo skaičiavimo ir mašininio mokymosi serija) iliustruotas leidimas

Parašė: Kevin P. Murphy

  • Leidėjas: The MIT Press
  • Paskelbimo data: 2012 m. rugpjūčio 24 d
  • Kalba: anglų
  • Matmenys: 8,25 x 1,79 x 9,27 colio
  • Puslapių skaičius: 1104

Ši knyga tinka pradedantiesiems. Vėlgi, kaip ir visos kitos šiame dokumente nurodytos knygos, ši knyga neapima visko, ko reikia bendrajai programai, kuri, deja, vis dar nėra baigta (specialistų programos taip pat vis dar nebaigtos). Įprastas pradedantysis čia yra vidurinės mokyklos absolventas, baigęs matematiką ir informatikos mokslus.

Turinys: Įvadas (Mašininis mokymasis: kas ir kodėl?, Mokymasis be priežiūros, Kai kurios pagrindinės mašininio mokymosi sąvokos); Tikimybė; Generatyvieji diskrečiųjų duomenų modeliai; Gauso modeliai; Bajeso statistika; Dažnotojų statistika; Tiesinė regresija; Logistinė regresija; Apibendrinti tiesiniai modeliai ir eksponentinė šeima; Režisuoti grafiniai modeliai (Bayes tinklai); Mišinių modeliai ir EM algoritmas; Latentiniai linijiniai modeliai; Reti linijiniai modeliai; Branduoliai; Gauso procesai; Adaptyvūs bazinių funkcijų modeliai; Markovo ir paslėptų Markovo modeliai; Valstybinės erdvės modeliai; Neorientuoti grafiniai modeliai (Markov atsitiktiniai laukai); Tikslios išvados grafiniams modeliams; Variacinė išvada; Daugiau variacinių išvadų; Monte Karlo išvada; Markovo grandinės Monte Karlo (MCMC) išvada; Klasterizavimas; Grafinio modelio struktūros mokymasis; Slapti kintamieji diskrečiųjų duomenų modeliai; Gilus mokymasis.

Duomenų mokslas verslui: ką reikia žinoti apie duomenų gavybą ir duomenų analitinį mąstymą / 1-asis leidimas

Parašė: Tom Fawcett ir Foster Provost

  • Leidėjas: O'Reilly Media
  • Paskelbimo data: 2013 m. rugsėjo 17 d
  • Kalba: anglų
  • Matmenys: 7 x 0,9 x 9,19 colio
  • Puslapių skaičius: 413

Turinys: duomenų analitinis mąstymas; Verslo problemos ir duomenų mokslo sprendimai; Įvadas į nuspėjamąjį modeliavimą: nuo koreliacijos iki prižiūrimo segmentavimo; Modelio pritaikymas duomenims; Perdozavimas ir jo vengimas; Panašumas, kaimynai ir klasteriai; Sprendimų analitinis mąstymas I: koks yra geras modelis?; Modelio veikimo vizualizavimas; Įrodymai ir tikimybės; Teksto atvaizdavimas ir kasimas; Sprendimų analitinis mąstymas II: Analitinės inžinerijos link; Kitos duomenų mokslo užduotys ir metodai; Duomenų mokslas ir verslo strategija; Išvada.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Praktinė statistika duomenų mokslininkams: daugiau nei 50 pagrindinių sąvokų naudojant R ir Python / 2-asis leidimas

Parašė: Peteris Bruce'as, Andrew Bruce'as ir Peteris Gedeckas

  • Leidėjas: O'Reilly Media
  • Paskelbimo data: 2020 m. birželio 2 d
  • Kalba: anglų
  • Matmenys: 7 x 0,9 x 9,1 colio
  • Puslapių skaičius: 368

Turinys: tiriamoji duomenų analizė, duomenų ir atrankos paskirstymas, statistiniai eksperimentai ir reikšmingumo tikrinimas, regresija ir numatymas, klasifikavimas, statistinis mašininis mokymasis, mokymasis be priežiūros.

Kodėl knyga: naujas priežasties ir pasekmės mokslas

Parašė: Judea Pearl, Dana Mackenzie

  • Leidėjas: Basic Book
  • Paskelbimo data: 2018 m. gegužės 15 d
  • Kalba: anglų
  • Matmenys: 6,3 x 1,4 x 9,4 colio
  • Puslapių skaičius: 432

Nors daugelyje duomenų mokslo knygų iliustracijai naudojama gryna verslo pramonė, šioje knygoje iliustracijai naudojama medicinos pramonė ir kitos disciplinos.

Turinys: Įvadas: Mind over Data; Priežastinio ryšio kopėčios; Nuo Buccaneers iki jūrų kiaulyčių: Priežastinės išvados genezė; Nuo įrodymų iki priežasčių: gerbiamas Bayesas susitinka su ponu Holmsu; Supainiojimas ir sumaišymas: arba, slepiasinčio kintamojo nužudymas; Dūmų pilnos diskusijos: oro išvalymas; Paradoksų gausybė!; Beyond Adjustment: The Conquest of Mount Intervention; Kontrafaktai: kasybos pasauliai, kurie galėjo būti; Tarpininkavimas: mechanizmo paieška; Dideli duomenys, dirbtinis intelektas ir dideli klausimai.

Kurkite karjerą duomenų mokslo srityje

Parašė: Emily Robinson ir Jacqueline Nolis

  • Leidėjas: Manning
  • Paskelbimo data: 2020 m. kovo 24 d
  • Kalba: anglų
  • Matmenys: 7,38 x 0,8 x 9,25 colio
  • Puslapių skaičius: 354

Turinys: Darbo su duomenų mokslu pradžia; Ieškoti duomenų mokslo darbo; Įsikūrimas duomenų moksle; Augate savo duomenų mokslo vaidmenyje.

https://www.manning.com/books/build-a-career-in-data-science

Duomenų mokslas manekenams / 2-asis leidimas

Parašė: Lillian Pierson

  • Leidėjas: For Dummies
  • Paskelbimo data: 2017 m. kovo 6 d
  • Kalba: Anglų
  • Matmenys: 7,3 x 1 x 9 colių
  • Puslapių skaičius: 384

Šioje knygoje daroma prielaida, kad skaitytojas jau turi iš anksto reikalingų matematikos ir programavimo žinių.

Turinys: galvos apvyniojimas duomenų mokslu; Duomenų inžinerijos vamzdynų ir infrastruktūros tyrinėjimas; Duomenimis pagrįstų įžvalgų taikymas verslui ir pramonei; Mašininis mokymasis: mokymasis iš duomenų naudojant savo įrenginį; Matematinis, tikimybių ir statistinis modeliavimas; Klasterizacijos naudojimas duomenims suskirstyti; Modeliavimas su egzemplioriais; Modelių, naudojančių daiktų interneto įrenginius, kūrimas; Duomenų vizualizacijos projektavimo principų laikymasis; D3.js naudojimas duomenų vizualizacijai; Internetinės vizualizacijos projektavimo programos; Geriausios informacijos suvestinės dizaino praktikos tyrinėjimas; Žemėlapių kūrimas iš erdvinių duomenų; Python naudojimas duomenų mokslui; Atvirojo kodo R naudojimas duomenų mokslui; SQL naudojimas duomenų moksle; Duomenų mokslas su Excel ir Knime; Duomenų mokslas žurnalistikoje: penkių W (ir H) prikalimas; Gilinimasis į aplinkos duomenų mokslą; Duomenų mokslas, skatinantis elektroninės komercijos augimą; Duomenų mokslo naudojimas nusikalstamai veiklai apibūdinti ir numatyti; Dešimt fenomenalių atvirųjų duomenų išteklių; Dešimt nemokamų duomenų mokslo įrankių ir programų.

Didžiulių duomenų rinkinių gavyba / 3 rd Redagavimas

Parašė: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Leidėjas: Cambridge University Press
  • Paskelbimo data: 2020 m. vasario 13 d
  • Kalba: Anglų
  • Matmenys: 7 x 1 x 9,75 colio
  • Puslapių skaičius: 565

Šioje knygoje taip pat daroma prielaida, kad skaitytojas jau turi iš anksto reikalingų matematikos ir programavimo žinių.

Turinys: duomenų gavyba; „MapReduce“ ir nauja programinės įrangos krūva; Algoritmai naudojant MapReduce; Panašių daiktų paieška; Duomenų srautų kasyba; Nuorodų analizė; Dažni daiktai; Klasterizavimas; Reklama internete; Rekomendavimo sistemos; Socialinių tinklų grafikų kasyba; Matmenų mažinimas; Didelio masto mašininis mokymasis.

Išvada

Specialistų programų skirtumai dar nėra aiškūs. Taip pat dar nėra aiškūs skirtumai tarp bendrųjų ir specializuotų programų. Tačiau perskaitęs pateiktą knygų sąrašą skaitytojas galės geriau įvertinti ypatingus duomenų analitiko, duomenų inžinerijos ir duomenų mokslininko vaidmenis ir tada judėti pirmyn.