Site Reliability Engineer

Icon
Icon ng Tagabuo
Icon
Icon ng Clipboard
Icon
Icon ng Palaisipan
Mga kaugnay na tungkulin: SRE Engineer, DevOps Engineer (SRE), Systems Reliability Engineer, Operations Engineer (SRE), Infrastructure Engineer (SRE), Site Operations Engineer, Production Engineer (SRE), Platform Engineer (SRE), Site Availability Engineer, Reliability Engineer

Mga spotlight

Mga Katulad na Pamagat

SRE Engineer, DevOps Engineer (SRE), Systems Reliability Engineer, Operations Engineer (SRE), Infrastructure Engineer (SRE), Site Operations Engineer, Production Engineer (SRE), Platform Engineer (SRE), Site Availability Engineer, Reliability Engineer

Deskripsyon ng trabaho

Bago ipinanganak ang DevOps, nagkaroon ng problema ang Google at hindi niya alam kung paano ito ayusin. Ang kumpanya ay nagpapatakbo ng malalaking site ngunit kailangan na pagbutihin ang mga ito at palakihin pa ang mga ito. Ang solusyon nito? Nag-tag ang Google ng isang pangkat ng mga software engineer upang malaman ito at mula sa kanilang mga pagsisikap ay nagmula ang pundasyon ng Site Reliability Engineering (SRE). Sa ngayon, tinukoy ng software giant ang SRE bilang "kung ano ang makukuha mo kapag tinatrato mo ang mga operasyon na parang ito ay isang problema sa software."

Napakahusay ng mga kasanayan sa SRE na pinagtibay ito ng iba pang malalaking kumpanya at, sa paglipas ng panahon, pinahusay at idinagdag, na nagreresulta sa larangan ng karera na nagbabahagi ng marami sa mga katangian ng mga DevOps ngayon ngunit may ilang mahahalagang pagkakaiba. Habang pareho ang umiiral sa gitna ng pag-unlad at pagpapatakbo, ang SRE ay higit na nakatuon sa automation. Sa katunayan, minsang inilarawan ng Google ang layunin ng inhinyero na, "i-automate ang kanilang paglabas sa isang trabaho."

Iba't ibang organisasyon ang gumagawa ng SRE at maaaring tawagin itong Production Engineering o Infrastructure Engineering sa halip. Anuman ang label nito, sa pagtatapos ng araw, trabaho ng isang engineer na maging isang team player na patuloy na nagtatrabaho para mapahusay ang pagiging maaasahan ng website, gumamit ng mga KPI sa pamamahala ng insidente (Key Performance Indicator), magsulat ng code, bumuo ng mga serbisyo, at mag-automate ng mga manual na proseso. Dahil ang mga site ay nananatiling 24 na oras sa isang araw, ang mga SRE ay madalas na gumagana on-call upang tumugon sa tuwing kailangan nila. 

Mga Aspektong Nagpapahalaga sa Karera
  • Paggawa gamit ang isang malaking larawan ng pangkalahatang-ideya ng mga proyekto
  • Nagsisilbing mahalagang tulay sa pagitan ng mga koponan 
  • Pagpapabuti ng mga proseso at pagtulong na palakasin ang mga kita ng organisasyon
  • Mapagbigay na kabayaran sa pananalapi
Ang Inside Scoop
Mga Pananagutan sa Trabaho

Oras ng trabaho

Ang SRE ay isang well-compensated na larangan ng karera, kaya asahan na kumita ng mga suweldo sa pamamagitan ng paglalagay ng mga full-time na oras! Tulad ng ipinaliwanag ng ParkMyCloud, ang pagiging maaasahan ng site ay mahalagang katumbas ng pagkakaroon ng negosyo. Sa madaling salita, nasa Mga Site Reliability Engineer na bawasan ang magastos na downtime. Maaaring isalin iyon sa pagtatrabaho pagkatapos ng mga oras o pagiging on-call upang mabilis na tumugon sa mga isyu. 


Mga Karaniwang Tungkulin

  • Paglikha o pagpapahusay ng software na nauugnay sa mga operasyon at suporta
  • Pag-optimize at pag-automate ng mga proseso
  • Pagtitiyak sa pagpapalabas ng mga kasanayan sa pagkakapare-pareho ng engineering
  • Pagtugon at pagliit ng pagdami ng suporta 
  • Pagkuha at pagdodokumento ng mga bagong natutunang impormasyon para sa sanggunian sa ibang pagkakataon, tulad ng paggawa ng mga runbook. Pag-iwas sa "siloing" o pag-iimbak ng maibabahaging kaalaman
  • Mga isyu sa pag-troubleshoot
  • Pagsasagawa ng mga pagsusuri sa insidente (kilala rin bilang postmortems, retrospectives, o root cause analysis) upang matukoy kung bakit nagkaroon ng problema nang hindi sinisisi 

Karagdagang Pananagutan

  • Paggawa on-call para sa pag-troubleshoot at iba pang mga isyu sa pagtugon sa insidente
  • Tinitiyak ang pagsunod sa mga protocol ng organisasyon 
  • Paglikha ng mga listahan ng item ng aksyon upang matugunan ang mga problema at mabawasan ang mga katulad na isyu sa hinaharap sa loob ng Siklo ng Buhay ng Pag-unlad ng Software
Mga Kasanayang Kailangan sa Trabaho

Soft Skills
 

  • Kakayahang mapadali ang pakikipagtulungan sa pagitan ng mga koponan
  • Analytical paglutas ng problema
  • Pansin sa detalye
  • Serbisyo sa customer 
  • Empatiya
  • Kakayahang umangkop
  • Nakatuon sa layunin
  • Lubos na organisado; mahusay na mga kasanayan sa pamamahala ng oras
  • Mausisa at mausisa
  • Mga kasanayan sa pamumuno at pamamahala
  • Objectivity
  • Nakatuon sa proseso
  • Pag-iisip ng katiyakan ng kalidad
  • Malakas na mga kasanayan sa komunikasyon

Teknikal na kasanayan

Ang mga SRE ay kinakailangang magkaroon ng ilang hanay ng kasanayan na nauugnay sa mga sumusunod:

  • Bumuo ng mga tool sa automation
  • Bumuo ng mga wika sa pagsasaayos
  • Mga compiler
  • Mga database
  • Disenyo ng mga distributed system
  • Ang kaalaman sa domain na nauugnay sa pangangasiwa ng system, pag-unlad, pamamahala ng pagsasaayos, pagsubok sa pagsasama
  • Pangkalahatang pamamahala ng source code
  • Mga installer
  • Networking
  • Mga operating system
  • Mga manager ng package
  • Seguridad
  • Software engineering
Iba't ibang Uri ng Organisasyon
  • Mga ahensya ng disenyo ng mga sistema ng computer
  • Mga korporasyon/kumpanya
  • Mga ahensya ng gobyerno/militar
  • Pangangalaga sa kalusugan 
  • Mga institusyong mas mataas na edukasyon
  • Media at libangan
Mga Inaasahan at Sakripisyo

Kung ang isang organisasyon ay may isang site o mga site na napakahalaga na kailangan nila ng Site Reliability Engineer, kung gayon ang mga inaasahan ay tatakbo nang mataas. Ayon sa Netguru, ang apat na pangunahing dahilan sa pag-hire ng SRE ay upang mabawasan ang downtime, asahan at pagaanin ang mga panganib, makamit ang mas mabilis na pag-unlad, at upang makatipid ng pera sa pamamagitan ng mga iyon at iba pang mga ipinatupad na proseso. Malinaw na ang mga Site Reliability Engineer ay punong-puno ng kanilang mga kamay, at habang sinusubukan nilang i-juggle ang workload, dapat din silang manatiling nangunguna sa mga pagbabago sa mundo ng IT.

Maaaring magtagal ang mga oras kapag nagkaroon ng mga problema, hindi pa banggitin sa lahat ng mga pag-ikot...na nangangahulugang kahit na off ka, technically on ka pa rin. Maaaring maikli ang mga oras ng pagtugon sa insidente, at iba-iba ang bawat tagapag-empleyo pagdating sa pagbabayad para sa trabahong ginawa pagkatapos ng mga oras. Ang ilan ay maaaring magbigay ng Paid Time Off, ang ilan ay maaaring magbigay ng dagdag na sahod, at ang ilan ay maaaring mag-alok ng taos-pusong "maraming salamat" at wala nang iba pa. 

Mga Kasalukuyang Uso

Ang SRE ay medyo bagong konsepto pa rin para sa maraming lumalagong organisasyon. Bilang resulta, ang isang trend ay sinusubukan pa rin ng mga negosyo na malaman kung paano ito pinakamahusay na pamahalaan. Ang isang pangunahing salik na nagtutulak sa pagtutulak para sa Site Reliability Engineering ay ang paglutas ng insidente, na nagmumungkahi ng paniwala na ang mga kumpanya ay napapagod na lamang sa pag-apula ng apoy at nais na makakuha ng mas mahusay na paghawak sa kanila.

Siyempre, pinapawi nito ang stress mula sa pamamahala sa pamamagitan ng paglalagay ng stress sa halip sa mga SRE. Ito naman, ay maaaring mangailangan sa mga tagapag-empleyo na humanap ng mga paraan upang mapanatiling malusog at maayos ang mga stressed-out na manggagawa, upang ang mga manggagawa ay maaaring gumana sa pinakamataas na kahusayan. Ginagawa ito ng ilang kumpanya nang mas mahusay kaysa sa iba, ngunit ang uso ay kilalanin ang halaga ng pag-aalaga sa mga abalang manggagawa na nangangalaga sa negosyo!

Anong uri ng mga bagay ang kinagigiliwang gawin ng mga tao sa karerang ito noong bata pa sila...

Ang pangalang "Site Reliability Engineer" ay nagbibigay sa amin ng ilang pahiwatig tungkol sa uri ng mga taong nagtatrabaho sa larangang ito. Nasisiyahan silang magtrabaho sa mga website, isang interes na binuo ng karamihan sa mga SRE sa kanilang kabataan. Sila ang may pananagutan sa pagtiyak na ang mga site ay "maaasahan," ibig sabihin ang lahat ay gumagana kung paano ito dapat kapag ito ay nararapat. Kaya ang mga manggagawa mismo ay dapat na mapagkakatiwalaan, na isa pang katangian na kadalasang hinahasa sa mga unang taon ng isang tao.

Ang gayong mga tao ay gustong maging maagap at handa at malamang na mahusay sa akademya. Sa katunayan, upang maging isang inhinyero ng anumang uri ay karaniwang nangangailangan ng malakas na kakayahan sa akademiko, lalo na sa matematika at agham, siyempre. Gayunpaman, ang isa sa mga kawili-wiling bagay tungkol sa larangang ito ay kung gaano karaming mga malambot na kasanayan ang pumapasok.

Ang isang SRE ay kailangang isang taong tao, isang taong kumportable sa pakikipagtulungan sa mga koponan, at kayang magsulong ng pakikipagtulungan sa pagitan ng mga pangkat na iyon. Bilang isang resulta, maaaring mayroon silang mga posisyon sa pamumuno sa paaralan, o marahil ay nagkaroon lamang ng maraming kapatid na kalabanin! Ang mga SRE ay mga eksperto sa kahusayan, na sinanay upang humanap ng mga paraan upang pagandahin ang mga bagay sa pamamagitan ng pag-aaral ng mga problema at pagtukoy ng mga solusyon batay sa kanilang pananaliksik. Nangangailangan ito ng malikhain ngunit analytical na pag-iisip na parang ang parehong hemispheres ng utak ay gumagana nang magkasabay. Posibleng maraming SRE ang ambidextrous o bihasa sa pagtugtog ng mga instrumentong pangmusika. 

Kailangan ang Edukasyon at Pagsasanay
  • Ang Site Reliability Engineer ay nangangailangan ng bachelor's degree, mas mabuti sa Computer Science o isang kaugnay na lugar
  • Walang nakatakdang landas para maging SRE. Ang ilang mga manggagawa ay pumasok sa pamamagitan ng isang internship; ang iba ay maaaring gumawa ng isang bootcamp, pagkatapos ay bumuo ng mga kasanayan habang gumagawa ng iba pang mga trabaho sa IT habang nagsasanay ng iba pang mga kasanayan sa kanilang sarili
    • Ang sapat na karanasan sa trabaho ay isang pangunahing kinakailangan ng karamihan sa mga employer (maraming empleyado ng SRE ang unang nagtatrabaho sa DevOps, sysadmin, o bilang mga developer o software engineer)
  • Mga klase para maging pamilyar sa Java, Python, Ruby, o C++, pati na rin sa Linux, Kubernetes, at MySQL
  • Mga kurso upang bumuo ng mga malambot na kasanayan sa Ingles, pagsulat, pagsasalita, pagtutulungan ng magkakasama, at pamumuno
  • Kasama sa mga opsyonal na sertipikasyon ang:
    • American Society for Quality's Reliability Engineer Certification
    • Sertipikasyon ng SRE Foundation ng DevOps Institute 
    • Linux+ Certification ng CompTIA
  • Matuto nang mag-isa sa pamamagitan ng pagkuha ng mga kurso sa:
    • edX - Panimula sa DevOps at Site Reliability Engineering
    • Lynda (mula sa LinkedIn) - DevOps Foundations: Site Reliability Engineering
    • Udemy - Isang Panimula sa Reliability Engineering
    • Coursera - Site Reliability Engineering: Pagsukat at Pamamahala ng Reliability
      • Tandaan, ang parehong kurso ay inaalok din sa Pluralsight
Mga bagay na hahanapin sa isang programa
  • Karamihan sa mga kailangan mong malaman upang maging isang matagumpay na Site Reliability Engineer ay matututuhan sa labas ng iyong programa sa kolehiyo!
  • Sa isip, maghanap ng mga programang nag-aalok ng mga kurso sa mga lugar na nakalista sa itaas
  • Basahin ang faculty bios para makita kung ano ang kanilang mga lugar ng kadalubhasaan at background
  • Anong mga uri ng mga club at organisasyon ng mag-aaral ang magagamit? Maraming malambot at teknikal na kasanayan ang pinakamabisang natutunan sa pamamagitan ng sapat na pakikipag-ugnayan ng mga kasamahan
  • Tiyaking akreditado ang paaralan
  • Maghanap ng mga programang naglalathala ng mga istatistika ng trabaho pagkatapos ng pagtatapos at may matatag na rekord
  • Timbangin ang mga kalamangan at kahinaan ng pag-enroll sa isang online na programa. Ang pakikipag-ugnayan sa campus ay lubhang kapaki-pakinabang para sa pagbuo ng mga malambot na kasanayan, kaya minsan ang isang hybrid na programa ay kapaki-pakinabang
Listahan ng mga Programa

Makakatulong sa iyo ang US News & World Report's Best Computer Science Programs na makapagsimula, ngunit huwag umasa lamang sa isang ranggo. Hindi mo gustong makaligtaan ang magagandang pagkakataon, kaya inirerekomenda naming isaalang-alang ang mga listahan gaya ng 50 Great Value College's 50 Great Affordable Colleges for Computer Science and Engineering para sa 2020 o Best Value School's Top 25 Computer Science Programs na May Pinakamagandang Return on Investment.

Ang kolehiyo ay maaaring maging lubhang mahal, ngunit tandaan na maraming mga tagapag-empleyo ay napakapraktikal. Maaaring mas interesado sila sa iyong hard technical skills kaysa sa kung saang paaralan ka nagtapos. Sa madaling salita, ang pagkakaroon lamang ng isang degree mula sa isang magastos na pribadong kolehiyo ay hindi magagarantiya ng trabaho sa linyang ito ng trabaho. Tumutok sa pagkuha ng mga partikular na klase na kailangan upang bumuo ng mga kasanayan, at makakuha ng mas maraming hands-on na karanasan hangga't maaari. 

Mga dapat gawin sa High School at College
  • Gaya ng nabanggit, walang iisang landas para maging SRE, kaya mag-map out ng ilang mga opsyon
  • Tingnan ang mga pag-post ng trabaho mula sa mga kumpanyang gusto mong magtrabaho. Bigyang-pansin ang mga kinakailangang karanasan sa trabaho at akademiko, pagkatapos ay i-reverse-engineer ang isang career path para makarating doon
  • Sa high school, bumuo ng matatag na pundasyon sa pamamagitan ng pagkuha ng maraming IT electives hangga't maaari
  • Kumuha ng mas maraming kasanayan sa hands-on hangga't kaya mo! Kumuha ng mga kursong nauugnay sa mga item sa aming Edukasyon at Pagsasanay sa itaas
  • Huwag kalimutang magtrabaho sa iyong pagsusulat. Mahalaga ang teknikal na pagsulat ngunit kakailanganin mo ring isalin ang mga kumplikadong paksa sa mga termino ng karaniwang tao
  • Ang mga SRE ay nangangailangan ng mahusay na pagtutulungan ng magkakasama at mga kasanayan sa pamumuno. Ang mga ito ay madalas na napapabayaan na mga katangian na inaasahan mong magkaroon sa ibang pagkakataon, kaya maghanap ng mga paraan upang mabuo ang mga ito nang maaga
  • Walang tatalo sa pagkakaroon ng isang bihasang tagapagturo kaya makipag-ugnayan sa mga alumni o guro para sa payo 
  • Turuan ang iba. Pinapadali ng pagtuturo ang mga bagong karanasan sa pag-aaral para sa magkabilang panig
  • Magbasa at sumali sa mga talakayan sa Quora, Reddit, Dev.to, at iba pang mga site
  • Kapag sapat na ang iyong mga kasanayan, kumuha ng ilang bayad na karanasan sa Upwork
  • Maghanap ng mga internship sa Indeed, o tanungin ang iyong programa sa kolehiyo kung mayroon silang mga pagkakataon
  • Maging lider sa mga club na nauugnay sa IT, at bumuo ng malawak na network ng mga kapantay at kasama!
Karaniwang Roadmap
Maaasahan ng Site Gladeo Roadmap
Paano makuha ang iyong unang trabaho
  • Ilabas ang salita! Karamihan sa mga trabaho ay matatagpuan na ngayon sa pamamagitan ng networking
  • Kumuha ng pagsubok sa screening ng TripleByte DevOps . Kung pumasa ka, makakakuha ka ng panayam sa mga employer sa kanilang network.
  • Maghanap ng mga pagbubukas sa Indeed, Monster, USAJobs, ZipRecruiter, LinkedIn, at Glassdoor
  • Alamin kung ano ang hinahanap ng mga employer! Ang Usenix ay may nada-download na .pdf na listahan ng mga tip sa tagaloob sa pagkuha ng mga SRE
  • Ang ilang mga tagapag-empleyo ay nagsasanay sa kanilang mga SRE sa loob ng bahay, kaya maaaring gusto mong magsimula sa isang trabaho ngunit may planong gawin ang iyong paraan sa loob ng kumpanya
  • Kumuha ng internship. Hindi sila palaging nagbabayad ng maayos ngunit makukuha mo ang iyong paa sa pinto at maaari silang humantong sa mga full-time na trabaho
  • Ang hurado ay alam kung gaano kapaki-pakinabang ang mga job fair, ngunit ang mga fairs na partikular sa industriya ay maaaring magbigay sa iyo ng ilang exposure sa kung anong mga pagkakataon ang umiiral at mag-alok ng pagkakataong makipag-chat sa mga manggagawa
  • Ayusin ang iyong resume. Ang Job Hero ay may ilang mahusay na template ng resume ng Site Reliability Engineer upang magnakaw ng mga ideya
  • Magsama ng isang propesyonal na manunulat ng resume (o editor) upang i-punch ang iyong doc at gawin itong pinakamahusay na magagawa nito. Ngunit tandaan, iangkop ang bawat resume sa partikular na trabahong ina-applyan mo
  • Pag-aralan ang napakalaking database ng mga mapagkukunan at mga tanong sa pakikipanayam ng GitHub!
Paano Umakyat sa Hagdan
  • Marami ang nakasalalay sa laki ng organisasyon. Ang ilang mga kumpanya ay nagpo-promote mula sa loob; ang iba ay maaaring gusto ng mga panlabas na kandidato. Ang mga talakayan sa pagkakataon sa promosyon ay dapat magkaroon ng maaga sa iyong superbisor
  • Maging maagap. Sanayin ang iyong sarili, kumuha ng mga kurso, magpatuloy sa pag-aaral. Kapag may bagong trend sa teknolohiya, alamin ang lahat ng iyong makakaya tungkol dito at maging eksperto sa paksa
  • Magpakita ng katapatan sa iyong kumpanya at maging isang pinagkakatiwalaan, napakahalagang asset na karapat-dapat sa pagtaas ng responsibilidad. Kumilos sa paraang nagpapahiwatig na handa ka nang sumulong
  • Laging tandaan ang mga soft skills. Kahit na ang pinaka-technically-skilled na empleyado ay mahihirapang umakyat kung hindi sila makisama sa iba
  • Maging boss. Ipakita ang iyong kakayahan at potensyal sa pamumuno. Ang isang SRE ay dapat na makapagdirekta sa iba sa isang collaborative ngunit mapagpasyang (at kapag kinakailangan, matatag) na paraan
  • Patunayan na ikaw ay maaasahan. Maging maagap, at kung on-call kang tumugon sa insidente nang mabilis, gawin ang trabaho nang masigasig, at humanap ng mga paraan upang mabawasan ang mga katulad na problema sa hinaharap 
Mga Inirerekomendang Mapagkukunan

Mga website

  • Advanced na Bash-Scripting 
  • Kahanga-hangang Python 
  • Gabay ni Beej sa Network Programming 
  • Hamon sa Utos 
  • Cyber Aces 
  • DevOps BootCamp 
  • DevOpsDays
  • Eli ang Computer Guy 
  • Git
  • Git Immersion 
  • Panimula sa SQL: Pagtatanong at pamamahala ng data
  • Katacoda
  • Engineering ng Operating System ng MIT
  • MongoDB University 
  • Ops School
  • Sa ibabaw ng Wire 
  • Pag-aaral ng Puppet 
  • SQLZOO 
  • SREcon 
  • SRE Lingguhan
  • Mga Cast ng Sysadmin 
  • Ang Malaking Blog Post ng Information Security Training Materials
  • Ang Geek Stuff
  • Ang Google SRE Book
  • Ang Bukas na Gabay sa Amazon Web Services 
  • Ang System Design Primer 
  • Ang Unix Workbench 
  • Unix Toolbox 

Mga libro

Plano B

Ang Site Reliability Engineering ay maaaring maging isang kapanapanabik na larangan ng karera na may isang toneladang responsibilidad. Gayunpaman, hindi palaging cut-and-dry ang landas sa pagpasok. Maraming tao ang nagsisimula sa ibang mga lugar, at kung minsan ay nananatili sila sa mga lugar na iyon. Ang ilang mga opsyon sa trabaho sa “Plan B” ay kinabibilangan ng::

  • Back-End Developer
  • Tagapamahala ng Computer at Information Systems
  • Computer Programmer
  • Computer Support Specialist
  • Analyst ng Computer Systems
  • Administrator ng Database
  • DevOps
  • Front-End Developer
  • Full-Stack Developer
  • Information Security Analyst

Newsfeed

Mga Online na Kurso at Tool