Hadoop er et af de mest magtfulde open source programmeringsrammer, og det er et vigtigt redskab for alle, der håber at finde et stort datajob. Hvis du vil børste op på dine Hadoop færdigheder eller lære at mestre det, er din bedste mulighed at tage et online kursus. Hvis det ikke er tilgængeligt for dig, kan du se gratis online tutorials og bruge referencematerialer til at fejle specifikke problemer. Når du først har det grundlæggende, træner du på små sæt af virkelige data for at forbedre dine færdigheder.

Metode En af To:
At tage kurser og bruge tutorials

  1. 1 Tilmeld dig Cloudera for en 6-delt kursus og interaktive tutorials. Cloudera giver dig eksempler på ægte verden til at praktisere i et skrivebeskyttet miljø, så du behøver ikke bekymre dig om at lave store fejl. De tilbyder også analytiske værktøjer til at hjælpe dig med at eksperimentere forespørgselsdata samt en gratis live-demo kaldet Cloudera Live, der hjælper dig med at lære Hadoop-miljøet.[1]
    • Selvom det komplette, dybdegående kursus med certificering vil koste dig $ 295, vil det helt sikkert være det værd, hvis du bruger disse færdigheder til dit job. Brug af Cloudera kurset hjælper dig med at fange fejl og spare tid, hvilket gør det hurtigt at betale for sig selv![2]
  2. 2 Prøv gratis online kurser gennem Cloudera hvis du allerede kender det grundlæggende. Hvis du har erfaring med Hadoop og bare vil have en genopfriskning, behøver du måske ikke at dække pengene til 6-delskurset. I stedet tjek de gratis online kurser på Cloudera Universitets hjemmeside.[3]
    • Der er ressourcer til administratorer, udviklere og dataanalytikere, så det er ligegyldigt hvad din rolle er, du bør kunne finde et passende kursus.
  3. 3 Tag kurs på Coursera på universitetets niveau, hvis du vil have mere teori. Coursera er en velkendt, respekteret kilde til programmeringskurser. Selv om instruktionerne generelt er mere teoretiske og ikke indeholder så mange løbende eksempler, kan du øve sammen med vejledningen og bruge kursusprojekterne til at få praktisk erfaring.[4]
    • Du kan finde kurset online på https://www.coursera.org/specializations/big-data.
    • Omkostningerne varierer mellem kurser, men Coursera tilbyder også en økonomisk hjælpemulighed til dem, der kvalificerer sig.
  4. 4 Følg et gratis kursus på Big Data University for en omkostningsvenlig løsning. Hvis du ikke ønsker at betale for et online kursus, er Big Data University en god mulighed. De har et 2-delt kursus, der først fokuserer på Hadoop-basics, derefter på programmering med Hadoop, og onlineformatet gør det nemt at gå i dit eget tempo.[5]
    • Du kan finde disse kurser på https://cognitiveclass.ai.
    • De tilbyder mange tutorials på engelsk, samt japansk, spansk, portugisisk og russisk.
  5. 5 Søg efter walkthroughs på YouTube, hvis du har brug for gratis, specifik træning. Der er tusindvis af videoer lavet til at forklare Hadoop og hvordan man kan udnytte det. Den brede vifte af videoer giver dig fleksibilitet, plus det er gratis. Hvis du løber ind i et bestemt problem, skal du søge på YouTube for en video, der går igennem processen.[6]
    • Hadoop tutorials bør også være ret let at finde, da "hadoop" er et unikt søgeord.[7]
  6. 6 Brug Yahoo's gratis tutorials, hvis du vil øve med et virtuelt eksempel. Disse tutorials er opdelt i 7 moduler, og de instruerer dig om at installere og betjene Hadoop fra begyndelsen. Dette er en god mulighed for at børste op på specifikke færdigheder, hvis de er lidt rustne.[8]
    • Du kan finde disse vejledninger til rådighed gratis på https://developer.yahoo.com/hadoop/tutorial/.
  7. 7 Se i IBM Open Source-dokumentet gratis, dybtgående instruktioner. Dette er et utroligt grundigt, åbent PDF-dokument, der er oprettet af et IBM-uddannelsesinitiativ. Den går igennem Hadoop omhyggeligt, trin for trin, og giver klare skriftlige instruktioner.
    • Du kan finde denne PDF på https://www.ibm.com/developerworks/data/library/techarticle/dm-1209hadoopbigdata/.
    • Disse instruktioner fungerer også godt, når de er parret med en live demo som Cloudera.[9]

Metode To af to:
Overgang til Real-World Application

  1. 1 Spørg om du kan implementere Hadoop på arbejdspladsen for at øve med rigtige data. Sæt en anmodning hos din chef eller vejledende eller tale med dem en-til-en om at bringe disse nye færdigheder ind på arbejdspladsen. Dette er især vigtigt, hvis din virksomhed betaler for nogen træning eller online kurser.[10]
    • Jo før du begynder at gennemføre de færdigheder, du har lært, jo hurtigere vil du kunne mestre dem!
  2. 2 Kig efter enkle projekter til at øve dine færdigheder på. Vælg projekter, der er relativt enkle og lavrisikologiske, såsom tælling og rangering af antallet af interaktioner pr. Kundeagent, som e-mails og chat-sessioner.[11]
    • Nogle andre rigtige dataapplikationer omfatter scanning gennem weblogs for fejl eller overvågning af sociale medier for brand-følelser.
    • Du kan også øve med eksempeldata fra websteder som https://www.kaggle.com/datasets eller https://aws.amazon.com/datasets/.
  3. 3 Kontroller jævnligt din kode med små undergrupper for at udarbejde eventuelle fejl. Før du kører hele datasættet, skal du tage et mindre testdatasæt på din lokale maskine og køre den gennem flere forskellige tilstande. For eksempel kan du køre det iterativt gennem Local Jobrunner Mode, derefter Pseudo-Distributed Mode og derefter Fully Distributed Mode.[12]
    • Dette vil lade dig genkende eventuelle fejl eller fejl, før de bliver forstærket i hele datasættet.
    • Lokal Jobrunner-tilstand giver dig mulighed for lokalt at teste og fejle din kort- og formindskningskode, Pseudodistribueret tilstand efterligner produktionsmiljøet, og fuldt distribueret tilstand ser på din virkelige produktionsklynge.
  4. 4 Brug en 1 års gratis prøveperiode til at praktisere i et virtuelt maskinmiljø. Virksomheder som Amazon og Microsoft tilbyder betalte abonnementer for deres Hadoop-praksis.Amazons virtuelle maskine hedder Amazon Web Service (AWS), og Microsofts service kaldes Microsoft Azure. For begge ydelser er dit første år gratis, når du indtaster dine kreditkortoplysninger.[13]
    • Glem ikke at annullere abonnementet efter 1 år for at undgå at blive opkrævet.