Kom frem i datalogi ved at lære et af disse lukrative sprog
Det er netop, hvad datavidenskabsfolk gør: opdager oplysninger, skaber forbindelser, skaber datavisualiseringer og hjælper virksomheder med at fungere effektivt.
Og en grundig forståelse af de rigtige programmeringssprog er afgørende for at tolke statistikker og arbejde med databaser.
Ifølge KDnuggets bruger 91% af datavidenskaberne følgende fire sprog.
Sprog 1: R
R er et statistikorienteret sprog, der er populært blandt data minearbejdere. Det er en open-source, objektorienteret implementering af S, og er ikke alt for svært at lære.
Hvis du vil lære at udvikle statistisk software, er R et godt sprog at vide. Det giver dig også mulighed for at manipulere og grafisk vise data.
Som en del af deres datalogi specialisering program, tilbyder Coursera en klasse på R, der ikke kun lærer dig at programmere på sproget, men går også over, hvordan man anvender det i forbindelse med datalogi / analyse.
Sprog 2: SAS
Som R anvendes SAS primært til statistisk analyse. Det er et kraftfuldt værktøj til at omdanne data fra databaser og regneark til læsbare formater (som HTML og PDF-dokumenter) samt de mere visuelle tabeller og grafer.
Oprindeligt udviklet af akademiske forskere, er det blevet et af de mest populære analytiske værktøjer verden over for virksomheder og organisationer af enhver art. Det er mere af en stor virksomhed type software og bruges ikke typisk af mindre virksomheder eller enkeltpersoner, der arbejder alene.
Ressourcer til at lære SAS er angivet i dette dokument .
Sproget er ikke open source, så du vil sandsynligvis ikke være i stand til at lære dig selv gratis.
Sprog 3: Python
Selvom R og SAS er mest almindeligt tænkt som "de store to" i analysearden, har Python for nylig også været en konkurrent. En af sine vigtigste frynsegoder er dens brede vifte af biblioteker (f.eks. Pandas, NumPy, SciPi osv.) Og statistiske funktioner.
Da Python (som R) er et open source-sprog, opdateres hurtigt til det. (Med købte programmer som SAS, skal du vente på den næste version frigivelse.)
En anden faktor at overveje, er at Python måske er den letteste at lære på grund af sin enkelhed og den brede tilgængelighed af kurser og ressourcer på den. Denne hjemmeside er et godt sted at starte.
Du kan også finde en mere komplet liste over Python læringsmaterialer her.
Sprog 4: SQL
Indtil videre har vi set på sprog, der er i samme familie og (mere eller mindre) har de samme funktioner. SQL, der står for "Structured Query Language," er, hvor det ændres. Dette sprog har intet at gøre med statistik; den fokuserer på at håndtere information i relationelle databaser.
Det er det mest anvendte databasesprog og er open source, så håbende datavidenskabere burde absolut ikke springe over det.
At lære SQL skal udstyre dig til at oprette SQL-databaser, administrere dataene i dem og bruge relevante funktioner. Udemy tilbyder et kursus, der dækker alt det grundlæggende og kan gennemføres ret hurtigt og smertefrit.
Konklusion
I det mindste skal du nok lære SQL og vælge mindst et af statistiksprogene. Men hvis du har tid (og i tilfældet med SAS, penge) og virkelig ønsker at gøre din markedsførbarhed, er der intet at sige, at du ikke kan lære alle fire!
Skynd dig ikke, få masser af øvelse, skræddersy dine færdigheder - og nyd jobsikkerheden.