Професії майбутнього: аналітик Big Data, розповідає Сергій Бориславський (Vodafone Україна)

Автор: Владислав Нужнов | 01 квітня 2023, 12:00

Коли абонент мобільного зв'язку має отримувати повідомлення про можливість підключити роумінг, щоб це було не запізно та не зарано? Як компанія знає — чи є у клієнта автомобіль, чи собака? Або — хто з її клієнтів чоловік, а хто — жінка, та як у цьому всьому залучене машинне навчання? За все це та багато іншого відповідає аналітик Big Data — людина, яка працює з величезною кількістю даних та перетворює ці дані на успішні продукти для своєї компанії та нові корисні можливості для її клієнтів. А ще поряд з ним працюють представники інших новітніх професій, які ще змінять наш світ у найближчому майбутньому: product scientist та data scientist. Редакція gg поспілкувалася з Сергієм Бориславським, начальником департаменту цифрових рішень та платформ Vodafone Україна. Він розповів про те, які мови програмування потрібно знати для роботи у цій сфері, де можна отримати фахові знання та як штучний інтелект зможе в майбутньому ще більше допомагати працювати з даними на користь всього людства.

Сергій Бориславський, начальник департаменту цифрових рішень та платформ Vodafone Україна

gg: З чого почалася ваша кар'єра і як ви прийшли до посади, яку обіймаєте?

Сергій Бориславський: Наразі в мене посада називається Начальник Департаменту цифрових рішень та платформ Vodafone. Ми створюємо цифрові продукти та впроваджуємо платформи, на яких ці продукти розгортаємо всередині компанії. А загалом мій шлях роботи в компанії Vodafone десь років 15. Починав я з "кузні кадрів" — call-центру. Причому працював там між парами. Потім я відправився в IT-службу — допомагав співробітникам справлятися з проблемами, які в них були на робочих місцях. Далі був фінансовим аналітиком з ризиків і вже потім став аналітиком даних. Спочатку створював підрозділ по роботі з великим даними для B2B сегменту (B2B — business to business, коли продажі відбуваються між компаніями або організаціями — примітка редакції). І після цього я вже очолив цей департамент.

gg: А на кого ви навчалися?

Сергій Бориславський: За фахом я менеджер, і коли я починав свою кар'єру в Vodafone, професії аналітик даних ще не існувало. Але у Vodafone завжди було досить багато даних, і завжди була велика кількість кейсів для того, щоб ми з цими даними працювали: для внутрішньої ефективності та для створення продуктів.

І мені треба було вивчати цю професію, коли вона тільки створювалася. Почав із мов програмування — це був SQL. Зараз ще спеціалісти вивчають Python. Це дві основні мови, з якими в основному працюють аналітики даних.

gg: SQL та Python обов'язкові для аналітика даних чи ні?

Сергій Бориславський: Декілька років тому, я б сказав: "так". Зараз ситуація трохи змінюється. Зараз є low-code інструменти (low-code development — концепція розробки програмного забезпечення з низьким рівнем кодування — примітка редакції), або no-code (розробка, яка взагалі не вимагає знань кодування — примітка редакції). Вони дають можливість використовувати в наявній бібліотеці або в застосунку, який використовує аналітик, вже готові дані.

Але потрібне фахове навчання, щоб розуміти, як все це працює. Бо від твоєї роботи багато чого залежить. Тобто, не просто показувати графіки, які дивляться вгору або вниз, а й розуміти, чому вони це роблять, яка буде динаміка в майбутньому, які інструменти були використані для того, щоб цей результат був максимально ефективним.

gg: З чого складається ваш типовий день? Які задачі ви виконуєте?

Сергій Бориславський: Почну з того, що зараз у мене в департаменті близько 25 людей, в основному це product scientist, які ведуть якісь проєкти та спілкуються із data scientist та data analyst. Частина цих проєктів засновані на даних, частина — ні. В другому випадку це платформи, які ми тільки запроваджуємо.

А загалом робочий день складається з того, що в мене є декілька основних зустрічей по продуктах, де ми обговорюємо раз на тиждень або раз у два тижні, на якому етапі в нас цей продукт або проєкт, які в нас є перепони, або які в нас графіки, та де я можу бути корисний.

Тому що product (scientist) — це як міні-CEO, який повинен мати чітке бачення того, як продукт буде виходити на ринок, та як його можна поліпшувати. І моя роль — допомагати моїм product scientist бути успішними. Тобто, якщо в них є якісь проблеми, або якщо вони не розуміють, як іти далі, то ми разом сідаємо і, або переробляємо стратегію по продукту, або розробляємо нову. Хоча буває таке, що все добре, і нам тільки необхідні додаткові ресурси, які ми можемо попросити у компанії.

gg: Можете пояснити різницю між data scientist та data analyst?

Сергій Бориславський: Data scientist працює на етапі, коли нам потрібно створити модель, яка дала б вигляд для продукту. Тобто product каже: "У моєму продукті мають бути такі метрики, як аудиторні сегменти", і data scientist бере дані з нашого сховища та на їхній основі, за допомогою нейромереж, створює ті показники, які будуть у продукті.

Тобто, це людина, яка використовує досить складні елементи штучного навчання для того, щоб бачити, який спосіб вирішення підходить. І це не завжди тільки аудиторний сегмент. Це може бути прогноз, наприклад: "А що буде, якщо ми зробимо щось". Наприклад, у нас був раніше проєкт, де ми співпрацювали із ритейл-мережею, де прогнозувалося, що якщо побудувати магазин в цій локації, тоді продажі будуть такими-от. Ми використовували дані мобільного оператора і клієнта, який нам їх надав, і, маючи штучний інтелект, робили прогнозування.

Аналітик даних (data analyst) — людина, яка вміє працювати з даними. Розуміє, де ці дані можуть знаходитися, як працювати з серверами, як працювати з інструментами обробки даних. Також він може створювати візуалізації даних та працювати з прогнозами.

Підсумовуючи: data scientist — архітектор, який будує структуру та модель машинного навчання, а data analyst — користується цим усім.

gg: А можете більше розповісти, чим займається product owner?

Сергій Бориславський: Якщо простими словами, то product — це директор маленького заводу, який формує продукт. У нього щоденні зустрічі з командою. Крім того, у product є щомісячні зустрічі зі мною, де він розповідає про свої досягнення та провали. Він активно розробляє нові продукти, і, що цікаво, у нього є право на помилку. Якщо product випустить продукт, який не на 100% задовольнятиме ринок, але він спробує, подивиться на помилки і тоді випустить більш успішний продукт.

gg: Можливо ще є ролі про які варто згадати?

Сергій Бориславський: Ще є data engineer, який допомагає data scientist та data analyst. Він забезпечує серверами, інструментами і швидкістю роботи. Він оптимізує робоче місце, щоб всі займалися своєю справою, а не думали "чому воно не працює так, як треба". Умовно — це системний адміністратор, який все оптимізує.

gg: Які б ви порадили курси для студентів які теж хочуть стати аналітиками даних?

Сергій Бориславський: У нас є школа Big Data Lab, яка готує повноцінних дата-аналітиків усього за півроку. Щоправда курс дуже інтенсивний, доволі складний та потребує певної базової підготовки. Він включає не лише теорію, а й роботу з реальними даними на практиці. Тож по закінченні спеціалісти вміють працювати з даними і виконувати конкретні бізнес-задачі. Початківцям можна почати з умовної Coursera.

Але наразі курсів настільки багато, що визначити, які з них найкращі, важко, але в цій сфері для мене головне, щоб людина була зацікавлена та допитлива. Вона має знаходити відповіді там, де іншим їх знайти досить важко. Якщо людина дійсно захоче знайти для себе курси — вона це зробить. Вони є як безкоштовні, так і платні. Я б не міг сказати, що платні курси в 100 разів краще. Це все залежить від людини. З безкоштовних курсів можна взяти багато чого. Я зараз говорю про свій шлях, бо не завжди була можливість купувати курси. Для початку порекомендую подивитися відео на YouTube та пошукати щось в Google. І потім обрати для себе шлях.

gg: А чи є університети, які навчають майбутніх аналітиків даних?

Сергій Бориславський: У світі точно таких вистачає, а щодо України — це, наприклад, Національний технічний інститут та Київський національний університет (імені Тараса Шевченка). Там дають фахові знання, які люди можуть використовувати. Ми досить багато брали до себе студентів саме з цих університетів, які у Vodafone працюють з даними. В основному вони працюють з внутрішніми кейсами — подивитись, що зараз необхідно абоненту, або яку послугу варто запропонувати. Далі ми допомагаємо цим людям отримувати нові знання та покращувати свої навички.

gg: Як саме Vodafone допомагає отримати нові знання?

Сергій Бориславський: Я вже згадав історію зі школою Big Data Lab. Після отримання освіти в ній ми навіть брали чимало нових людей до себе в команду. Якщо в тебе є можливість, і ти хочеш працювати з даними, то ця програма як раз для таких. І навіть війна не внесла значних змін у цей процес.

gg: Які технології та інструменти використовуються для роботи з великими даними? Можливо ChatGPT?

Сергій Бориславський: ChatGPT ще не використовуємо, але вивчаємо. Ті кейси, які ми бачимо, можна використовувати для обслуговування. Цей штучний інтелект можна наситити даними. Сказати, що тепер ти оператор контакт-центру, частково інтегрувати його з білінгом, і тоді ChatGPT 24/7 зможе використовувати дані про нашого оператора, наші дані та інформацію про наші тарифи, щоб надавати сервіс клієнту. Я думаю, що в недалекому майбутньому такі кейси будуть виникати.

Тільки тут ще стоїть питання безпеки. Ми вивчаємо його, щоб зрозуміти, чи можемо використовувати подібне рішення всередині компанії, щоб не стався витік даних наших клієнтів.

gg: А які тоді технології використовує Vodafone?

Сергій Бориславський: Це різні власні моделі машинного навчання в залежності від кейсів. Коли треба зрозуміти, хто користується автомобілем, — одна модель, коли треба поділити клієнтів на чоловіків та жінок — інша модель. Ми знаємо, що в тих або інших кейсах окрема модель показує себе краще. І людина, яка працює з цими машинами, повинна розуміти, в яких кейсах яка модель матиме більший успіх. Тому не вийде взяти готовий застосунок, де внесені всі дані і отримати 100% результат. Поки це так не працює.

А взагалі, штучний інтелект у майбутньому буде сам ставити перед собою завдання відповідно до попиту

gg: Ті моделі машинного навчання, які ви використовуєте, скільки часу потрібно, щоб їх навчити?

Сергій Бориславський: Залежить від того, наскільки у вас потужні сервери, і які задачі вам потрібні. Щоб навчити нейромережу простим командам з потужним сервером, треба від години до декількох днів. Наприклад, ми даємо data set, де вказано, хто із наших клієнтів чоловіки, а хто жінки — навчайся. Потім знову даємо data set, але не вказуємо, хто є хто, а вже ставимо задачу: поділити аудиторію на чоловіків і жінок. З нашим досвідом це можна зробити за годину. Але якщо робимо великий об'єм, де потрібно декілька нейромереж, де одна опрацювала результат, надала дані і далі опрацьовує результат наступна, то навчання може тривати декілька днів. Ще за нейромережею потрібно постійно слідкувати, щоб вона постійно видавала нові дані та не деградувала, бо тоді вона буде надавати гірші дані. Якщо вже це (деградація) сталося, то потрібно нейромережу вчити з самого початку, щоб вона видавала хороші результати.

gg: Які приклади використання аналітики big data можна знайти в реальному житті?

Сергій Бориславський: Якщо брати кейси Vodafone, то це кейси, які дають оператору можливість подивитися, чим людина користується і чи задоволена вона нашими послугами, і пропонувати додаткові функції, щоб людина з нами залишалася якомога довше.

Ще є кейс — підозрілий номер. Якщо клієнт підключає цю функцію, то до нього не доходять повідомлення або дзвінки, коли наша система визначає, що це може нести для клієнта потенційну загрозу. Наприклад, у нас є підозра, що ця людина може використати ваші персональні дані.

gg: Яку ще перспективу ви бачите у використанні нейромереж?

Сергій Бориславський: Вони позбавлять нас необхідності витрачати час на якісь задачі, які ми робимо зараз. Наприклад, робити презентацію за вас, використовуючи ті дані, які у вас є, або робити аналітику якогось тексту. Людина буде витрачати свій час ефективніше: для формування думки або усвідомлення того, в якому напрямку йти. Я бачу, що ШІ буде значно економити час на пошук відповідей. Наприклад, використовуючи Google, для пошуку відповіді потрібно зайти на 10 сайтів, а ChatGPT може зробити це одразу.

gg: Головна магія штучного інтелекту у двох речах: прогнозування та розвантаження людства від рутинних справ?

Сергій Бориславський: Так, але ще хотілося б, щоб ШІ малював картини чи писав музику, але наразі у цих задачах людина є фаворитом. А повний переворот настане тоді, коли ШІ буде не просто створювати умовний дизайн меблів, але й пояснювати, чому це буде продаватися.

gg: Чи зможе ШІ замінити повноцінно якісь професії?

Сергій Бориславський: Я бачу два варіанти розвитку:

Такі професії, як дизайнер чи копірайтер, зникнуть
Люди будуть використовувати ШІ для покращення результатів та стануть більш ефективним, бо нейронним мережам ще треба задавати правильний запит, і для створення меблів ніхто не зробить запит краще за дизайнера.

А в майбутньому для більшості професій ШІ забиратиме роботу на себе. Це не означає, що усіх звільнять, просто у людства з'являється помічник, який буде другим пілотом.

gg: Повертаючись до вашої роботи, як вона змінилася під час війни?

Сергій Бориславський: Ще у 2019 році ми створили інфраструктуру, щоб кожен у компанії міг працювати з будь-якої точки світу. У всіх нас є ноутбуки та захищені канали доступу до наших ресурсів. Тільки інтернет потрібен. І війна показала, що якщо є інтернет — ми можемо продовжувати виконувати роботу. Але це одночасно плюс і мінус. Плюс — можна працювати будь-де і завжди. Мінус — не вистачає живого спілкування з колегами. Особисто я зіштовхнувся з єдиною проблемою — перебої з інтернетом та світлом, але це було у більшості українців. А труднощів зі сторони компанії не було. Вся інфраструктура знаходиться у хмарі, тому працювати можна.

gg: Як би ви розповіли дитині чим ви займаєтесь?

Сергій Бориславський: Моїй старшій дитині майже 9 років і півтора роки тому я її привів в офіс, і вона питала мене: "Тато, а чим ти займаєшся?". І якщо казати про аналітику даних продуктів, — це досить складно. Я старався пояснити, що ми робимо такі речі, які допомагають нашим клієнтам ставати краще. Думаю, через рік вже буде інша дискусія з дитиною, де будуть приклади, але поки так. Ще в мене є друга дитина, яка скоро підросте і буде теж питати, чим я займаюся. Тож я подумаю, яка відповідь більш підійде для 5-річного малюка.

Професії майбутнього: аналітик Big Data, розповідає Сергій Бориславський (Vodafone Україна)

Для тих, хто хоче знати більше