Beroepen van de toekomst: Big Data-analist, zegt Sergei Boryslavskyi (Vodafone Oekraïne)
Wanneer moet een gsm-abonnee een melding krijgen van de roamingoptie, zodat het niet te laat of te vroeg is? Hoe weet een bedrijf of een klant een auto of een hond heeft? Of welke van zijn klanten man en welke vrouw is, en hoe wordt machine learning bij dit alles betrokken? De Big Data-analist is verantwoordelijk voor dit alles en nog veel meer - iemand die werkt met enorme hoeveelheden gegevens en die gegevens omzet in succesvolle producten voor zijn bedrijf en nieuwe nuttige mogelijkheden voor zijn klanten. Hij wordt ook vergezeld door vertegenwoordigers van andere geavanceerde beroepen die onze wereld in de nabije toekomst zullen veranderen: de productwetenschapper en de datawetenschapper. De redactie van gg sprak met Serhiy Boryslavskyi, hoofd digitale oplossingen en platforms bij Vodafone Oekraïne. Hij sprak over welke programmeertalen men moet kennen om op dit gebied te werken, waar men professionele kennis kan krijgen, en hoe kunstmatige intelligentie in de toekomst verder zal helpen om met gegevens te werken ten voordele van de mensheid.
Sergiy Boryslavskyi, hoofd van de afdeling Digital Solutions and Platforms, Vodafone Oekraïne
gg: Hoe is uw carrière begonnen en hoe bent u tot de positie gekomen die u bekleedt?
Sergiy Boryslavskiy: Nu heet mijn functie Head of Digital Solutions and Platforms Department bij Vodafone. We creëren digitale producten en implementeren platforms waarop we deze producten intern inzetten. Maar over het geheel genomen is mijn manier van werken bij Vodafone ongeveer 15 jaar. Ik ben begonnen bij de "smederij van het personeel" - het callcenter. En ik werkte daar tussen koppels. Toen ging ik naar de IT dienst - ik hielp werknemers met problemen die ze hadden op hun werkplek. Toen was ik financieel risico analist, en toen werd ik data analist. Eerst zette ik een big data-divisie op voor het B2B-segment (B2B is business to business, waarbij de verkoop plaatsvindt tussen bedrijven of organisaties - noot van de redactie). En daarna stond ik al aan het hoofd van die afdeling.
gg: Voor wie heb je gestudeerd?
Sergiy Boryslavskiy: Ik ben manager van beroep, en toen ik mijn carrière bij Vodafone begon, bestond het beroep van data-analist nog niet. Maar Vodafone heeft altijd vrij veel gegevens gehad, en er waren altijd veel gevallen waarin we met deze gegevens moesten werken: voor interne efficiëntie en voor het creëren van producten.
En ik had het vak moeten leren toen het net was ontstaan. Ik begon met programmeertalen - het was SQL. Nu leren meer specialisten Python. Dat zijn de twee belangrijkste talen waarmee data-analisten meestal werken.
gg: Zijn SQL en Python verplicht voor een data-analist of niet?
Sergey Borislavsky: Een paar jaar geleden zou ik gezegd hebben: "ja". Nu is de situatie een beetje aan het veranderen. Nu zijn er low-code tools (low-code ontwikkelingsconcept - noot van de redacteur), of no-code (ontwikkeling waarvoor helemaal geen coderingskennis nodig is - noot van de redacteur). Zij maken het mogelijk de gegevens te gebruiken in een bestaande bibliotheek of in een toepassing die de analist kant-en-klaar gebruikt.
Maar je hebt een professionele opleiding nodig om te begrijpen hoe het allemaal werkt. Want veel hangt af van je werk. Dat wil zeggen, niet alleen grafieken tonen die omhoog of omlaag kijken, maar begrijpen waarom ze dat doen, wat de dynamiek in de toekomst zal zijn, welke hulpmiddelen zijn gebruikt om dat resultaat zo efficiënt mogelijk te maken.
gg: Waaruit bestaat uw typische dag? Welke taken voert u uit?
Sergey Boryslavsky: Om te beginnen heb ik nu ongeveer 25 mensen in mijn afdeling, voornamelijk productwetenschappers die sommige projecten leiden en communiceren met datawetenschappers en data-analisten. Sommige van deze projecten zijn gebaseerd op gegevens, andere niet. In het tweede geval gaat het om platforms die we net aan het implementeren zijn.
In het algemeen bestaat de werkdag eruit dat ik verschillende basis productvergaderingen heb, waarin we eens per week of eens per twee weken bespreken in welk stadium we ons bevinden in dit product of project, welke obstakels we hebben, of welke planningen we hebben, en waar ik nuttig kan zijn.
Want de product(wetenschapper) is als een mini-CEO, die een duidelijke visie moet hebben over hoe het product naar de markt gaat en hoe het verbeterd kan worden. En mijn rol is om mijn productwetenschapper te helpen succesvol te zijn. Dat wil zeggen, als ze problemen hebben, of als ze niet begrijpen hoe het verder moet, dan gaan we samen zitten en herzien we de productstrategie of ontwikkelen we een nieuwe. Hoewel er ook momenten zijn waarop alles in orde is en we gewoon wat extra middelen nodig hebben die we aan het bedrijf kunnen vragen.
gg: Kunt u het verschil uitleggen tussen data scientist en data analist?
Sergey Borislavsky: De data scientist werkt in het stadium waarin we een model moeten creëren dat een beeld geeft voor het product. Dat wil zeggen, het product zegt: "Mijn product moet zulke statistieken hebben als publiekssegmenten," en data scientist neemt gegevens uit onze opslag en gebruikt die, met behulp van neurale netwerken, om die indicatoren te creëren die in het product zullen zitten.
Met andere woorden, dit is iemand die vrij geavanceerde elementen van kunstmatig leren gebruikt om te zien welke oplossing geschikt is. En het is niet altijd alleen het publiekssegment. Het kan bijvoorbeeld een voorspelling zijn: "Wat zou er gebeuren als we iets zouden doen". We hadden bijvoorbeeld een eerder project waarbij we samenwerkten met een winkelketen waarbij werd voorspeld dat als we op deze locatie een winkel zouden bouwen, de verkoop zo-en-zo zou zijn. We gebruikten gegevens van de mobiele operator en de klant die ons die gegevens bezorgden, en met kunstmatige intelligentie maakten we de voorspellingen.
Een data-analist is iemand die weet hoe hij met gegevens moet werken. Hij begrijpt waar die gegevens zich kunnen bevinden, hoe hij met servers moet werken, hoe hij met tools voor gegevensverwerking moet werken. Hij kan ook datavisualisaties maken en met prognoses werken.
Samengevat: De data scientist is de architect die de structuur en het model van machine learning bouwt, en de data analist gebruikt het allemaal.
gg: Kunt u ons meer vertellen over wat een product owner doet?
Sergey Borislavsky: Eenvoudig gezegd is product de directeur van een kleine fabriek die het product vormgeeft. Hij heeft dagelijkse vergaderingen met het team. Daarnaast heeft product maandelijkse vergaderingen met mij, waar hij praat over zijn successen en mislukkingen. Hij ontwikkelt actief nieuwe producten, en, interessant, hij heeft een foutenmarge. Als product een product uitbrengt dat niet 100% verkoopbaar is zal hij het proberen, de fouten bekijken en vervolgens een succesvoller product uitbrengen.
gg: Zijn er misschien nog andere rollen die het vermelden waard zijn?
Sergey Borislavsky: Er is ook een data engineer die de data scientist en data analist bijstaat. Hij zorgt voor servers, tools en snelheid. Hij optimaliseert de werkplek, zodat iedereen zijn werk doet in plaats van te denken "waarom het niet werkt zoals het zou moeten". Conventioneel is het een systeembeheerder die alles optimaliseert.
gg: Welke cursussen zou u aanraden aan studenten die ook data-analist willen worden?
Sergey Borislavsky: Wij hebben de Big Data Lab school, die volwaardige data-analisten opleidt in slechts zes maanden. Het is waar dat de cursus zeer intensief is, vrij ingewikkeld en enige basisopleiding vereist. Het omvat niet alleen theorie, maar ook het werken met echte gegevens in de praktijk. Daarom weten specialisten na afloop hoe ze met gegevens moeten werken en specifieke bedrijfstaken moeten uitvoeren. Voor beginners zou je kunnen beginnen met het fictieve Coursera.
Maar er zijn nu zoveel cursussen dat het moeilijk is om te bepalen welke de beste zijn, maar op dit gebied staat voor mij voorop dat iemand geïnteresseerd en leergierig moet zijn. Hij moet antwoorden vinden waar anderen dat heel moeilijk vinden. Als iemand echt een cursus voor zichzelf wil vinden, zal hij dat doen. Er zijn zowel gratis als betaalde cursussen. Ik zou niet zeggen dat betaalde cursussen 100 keer beter zijn. Het hangt allemaal af van de persoon. Uit gratis cursussen kun je veel halen. Ik heb het nu over mijn manier, want ik heb niet altijd cursussen kunnen kopen. Om te beginnen zou ik aanraden video's op YouTube te bekijken en iets op te zoeken op Google. En dan voor jezelf een pad kiezen.
gg: Zijn er universiteiten die toekomstige data-analisten opleiden?
Sergiy Boryslavskyy: In de wereld zijn er veel, en wat Oekraïne betreft - dat zijn bijvoorbeeld het Nationaal Technisch Instituut en de Kyiv National Taras Shevchenko University. Zij geven vakkennis die mensen kunnen gebruiken. We hebben heel wat studenten van deze universiteiten aangenomen die bij Vodafone met gegevens werken. In principe werken ze met interne gevallen - om te zien wat de abonnee nu nodig heeft, of welke dienst de moeite waard is om aan te bieden. Vervolgens helpen we deze mensen nieuwe kennis op te doen en hun vaardigheden te verbeteren.
gg: Hoe helpt Vodafone je precies om nieuwe kennis op te doen?
Serhiy Boryslavskiy: Ik herinnerde me al het verhaal met de Big Data Lab-school. Nadat we daar een opleiding hadden gevolgd, hebben we zelfs heel wat nieuwe mensen in ons team opgenomen. Als je een kans hebt en met data wilt werken, dan is deze opleiding iets voor hen. En zelfs de oorlog maakte niet veel verschil.
gg: Welke technologieën en tools worden gebruikt om met big data te werken? ChatGPT misschien?
Sergey Borislavsky: We gebruiken ChatGPT nog niet, maar we bestuderen het. De gevallen die we zien kunnen worden gebruikt voor onderhoud. Deze kunstmatige intelligentie kan worden verzadigd met gegevens. Stel dat je nu een contactcenterexploitant bent, die gedeeltelijk integreert met facturering, en dan kan ChatGPT 24/7 onze exploitantgegevens, onze gegevens en informatie over onze tarieven gebruiken om de klant van dienst te zijn. Ik denk dat dergelijke gevallen zich in de nabije toekomst zullen voordoen.
Alleen is er hier nog een beveiligingsprobleem. We onderzoeken of we een dergelijke oplossing intern kunnen gebruiken, zodat er geen gegevens van onze klanten uitlekken.
gg: Welke technologieën gebruikt Vodafone dan?
Serhiy Boryslavskiy: Dat zijn verschillende eigen machine learning-modellen, afhankelijk van de gevallen. Wanneer het nodig is om te begrijpen wie een auto gebruikt - één model, wanneer het nodig is om klanten te verdelen in mannen en vrouwen - een ander model. We weten dat in bepaalde gevallen een bepaald model beter presteert. En iemand die met deze auto's werkt moet begrijpen in welke gevallen welk model meer succes zal hebben. Daarom kun je geen kant-en-klare applicatie met alle gegevens nemen en 100% resultaat krijgen. Zo werkt het tot nu toe niet.
En in het algemeen zal kunstmatige intelligentie in de toekomst zichzelf taken stellen naargelang de vraag
gg: Die modellen voor machinaal leren die u gebruikt, hoe lang duurt het om ze te trainen?
Sergei Borislavsky: Dat hangt af van hoe krachtig uw servers zijn en welke taken u nodig hebt. Om een neuraal netwerk te trainen voor eenvoudige opdrachten met een krachtige server, duurt het van een uur tot enkele dagen. We geven bijvoorbeeld een dataset, die aangeeft welke van onze klanten mannen en welke vrouwen zijn - leren. Dan geven we de dataset opnieuw, maar we specificeren niet wie wie is, en stellen reeds de opdracht: verdeel het publiek in mannen en vrouwen. Met onze ervaring kan dit in een uur worden gedaan. Maar als we een grote hoeveelheid werk doen, waarbij we verschillende neurale netwerken nodig hebben, waarbij de ene het resultaat verwerkt, gegevens verstrekt, en de volgende het resultaat verwerkt, dan kan de training een paar dagen duren. Ook moet het neurale netwerk voortdurend in de gaten worden gehouden om ervoor te zorgen dat het voortdurend nieuwe gegevens geeft en niet degradeert, want dan geeft het de slechtste gegevens. Als dit (degradatie) al gebeurd is, moet je het neurale netwerk vanaf het begin trainen zodat het goede resultaten oplevert.
gg: Welke voorbeelden van het gebruik van big data analytics zijn er in de praktijk?
Sergey Boryslavskyy: Als we de gevallen van Vodafone nemen, zijn dat gevallen die de operator in staat stellen om te zien wat mensen gebruiken en of ze tevreden zijn met onze diensten, en om extra functies aan te bieden om ze zo lang mogelijk bij ons te houden.
Er is ook het geval van het verdachte nummer. Als een klant deze functie activeert, worden er geen berichten of oproepen ontvangen wanneer ons systeem vaststelt dat dit een potentiële bedreiging voor de klant kan vormen. We hebben bijvoorbeeld het vermoeden dat deze persoon uw persoonlijke gegevens zou kunnen gebruiken.
gg: Welke andere perspectieven ziet u in het gebruik van neurale netwerken?
Sergei Borislavsky: Ze zullen ons tijd besparen bij sommige taken die we nu doen. Bijvoorbeeld om een presentatie voor u te maken met behulp van de gegevens die u hebt, of om analytics te doen op een bepaalde tekst. Een mens zal zijn tijd efficiënter besteden: om een gedachte te vormen of om te weten in welke richting hij moet gaan. Ik zie dat AI veel tijd zal besparen bij het vinden van antwoorden. Als je bijvoorbeeld Google gebruikt, moet je naar 10 sites gaan om een antwoord te vinden, terwijl ChatGPT dat in één keer kan doen.
gg: De belangrijkste magie van kunstmatige intelligentie zit in twee dingen: voorspellen en de mens verlossen van routinetaken?
Sergej Borislavski: Ja, maar het zou wenselijk zijn dat AI schilderijen maakt of muziek schrijft, maar tot nu toe is de mens favoriet in deze taken. En een complete revolutie zal komen wanneer AI niet alleen een conventioneel meubelontwerp zal maken, maar ook zal uitleggen waarom het zal verkopen.
gg: Zal AI sommige beroepen volledig kunnen vervangen?
Sergey Borislavsky: Ik zie twee varianten van ontwikkeling:
- Beroepen als ontwerper of copywriter zullen verdwijnen...
- Mensen zullen AI gebruiken om resultaten te verbeteren en efficiënter te worden, omdat neurale netwerken nog steeds een goed verzoek moeten doen, en niemand zal een beter verzoek doen dan een ontwerper om meubels te maken.
En in de toekomst zal AI voor de meeste beroepen het werk overnemen. Dat betekent niet dat iedereen zal worden ontslagen, alleen dat de mensheid een sidekick zal hebben die een copiloot zal zijn.
gg: Terugkomend op uw baan, hoe veranderde die tijdens de oorlog?
Sergei Boryslavsky: In 2019 hebben we een infrastructuur gecreëerd zodat iedereen in het bedrijf overal ter wereld kan werken. We hebben allemaal laptops en beveiligde kanalen om toegang te krijgen tot onze middelen. Alleen het internet is nodig. En de oorlog heeft aangetoond dat als er internet is, we werk kunnen blijven doen. Maar dit is zowel een plus- als een minpunt. Pluspunt: je kunt overal en altijd werken. Minpunt - er is een gebrek aan live communicatie met collega's. Persoonlijk had ik het enige probleem - er waren wat internet- en lichtstoringen, maar dat geldt voor de meeste Oekraïners. En van de kant van het bedrijf waren er geen moeilijkheden. De hele infrastructuur bevindt zich in de cloud, dus er kan gewerkt worden.
gg: Hoe zou u een kind vertellen wat u doet?
Serhiy Boryslavskyy: Mijn oudste kind is bijna 9 jaar oud en anderhalf jaar geleden nam ik haar mee naar kantoor en vroeg ze me: "Papa, wat doe jij? En als we het hebben over het analyseren van productgegevens - dat is nogal ingewikkeld. Ik probeerde uit te leggen dat we dingen doen die onze klanten helpen beter te worden. Ik denk dat er over een jaar weer een gesprek met een kind komt waarin er voorbeelden zijn, maar voor nu is het zo. Ik heb ook een tweede kind dat binnenkort groot wordt en ook zal vragen wat ik doe. Ik zal dus nadenken over welk antwoord beter past bij een kleuter van 5 jaar.
Voor degenen die meer willen weten
- Het onbereikbare toppunt van kunst: waarom tekent de kunstmatige intelligentie van Midjourney 6 vingers op je handen en hoe kan dit verholpen worden?
- Dmitry Yakovlev (MacPaw): Gratis VPN-voorziening is geen geldverlies maar onze bijdrage aan de Oekraïense informatiebeveiliging
- Valery Yakovenko (EcoFlow): We zouden thuis elektriciteit moeten produceren om het zelf te verbruiken
- Van schuimvliegtuigen tot universeel platform SKIF: het verhaal van het Oekraïense bedrijf Culver Aviation
- The Stray story: hoe een kat uit een cyberstad de ontdekking van het jaar werd en de game-industrie beïnvloedde