Кариера в IT-специалисти по работа с данни-анализатори на данни, учени по данни

  •  

Публикацията е обновена на

Икономиката преминава през нова дигитална революция и компаниите се нуждаят от професионалисти по работа с данни, които могат да се справят отлично с промяната. Големите данни, изкуственият интелект, интернет на нещата и екологичната устойчивост са предназначени да стимулират общото търсене на работа. И сред най-търсените фигури сега, но и в близко бъдеще са и тези на анализатора на данни (Data Analyst), на учения по данни (Data Scientist), на инженера по данни (Data Engineer)

Какво правят анализаторите, учените и инженерите по данните

Data Analyst

Той е професионалист, с редица умения, които позволяват на компаниите да анализират, агрегират данни. Тези данни са им нужни, за да създават нови бизнес модели и да генерират предимство на пазара пред конкурентните фирми. Анализите на един такъв специалист обхващат бизнес единиците трансверсално, превръщайки данните в разбираема информация.

Data Scientist

През последните години се появи нова професионална фигура, която играе ключова роля в анализа на данните: учен по данните. Тези специалисти са експерти, които могат да извлекат същността от огромни количества структурирани и неструктурирани данни, за да помогнат за специфични нужди и бизнес цели.  Компаниите все повече разчитат на Big Data и анализите, за да подкрепят процесите на вземане на решения. Както разчитат и на облачните технологии, автоматизацията и машинното обучение като основни компоненти на техните ИТ стратегии.

Data Engineer

Централна фигура в управлението на информационния тръбопровод, т.е. инфраструктурата, която от мястото, където се събират данните, ги транспортира до предните инструменти. Задачата на Data Engineer се състои в своевременно предоставяне на учените данни във формати, които могат да се използват за анализ. Засега тази фигура е малко присъстваща в компаниите, но съществува неформално. Неговите задължения се извършват от хора в ИТ или от доставчика на технологии.

За работата си ни разказва един експерт по данните

Експертите по данните могат да поръчват и анализират големи количества файлове в Excel, да обработват информацията, съдържаща се в нея, като огъват сложността на данните към различните бизнес нужди.

Често става въпрос за работа с огромна маса електронни таблици, толкова много тежки файлове, които трябва да бъдат реорганизирани, така че да се разработят доклади и анализи, които да помогнат на мениджърите да планират по-добри стратегии. – Джулия Лупиди 

Джулия Лупиди е на 26 години, работи като анализатор на данни за международна консултантска и одиторска компания.

Като консултант работя по различни проекти, свързани с клиенти, които принадлежат към много отдалечени области. Общо всеки има много данни, защото често те са големи компании, които оперират на международните пазари.

Опитвам се да ги сортирам и след това да ги анализирам по-ефективно. Например с колегите си създаваме различни групи сметки, разработваме кодове и математически формули, които автоматизират изчислителните процеси. По-късно разработваме по-конкретни доклади, за да предложим планове за действие за бъдещето

– продължава Джулия. Работа, която не завършва с анализ, а продължава с представянето на данните:

Докладът трябва да бъде красив и разбираем, клиентът трябва да може да се консултира с цялата информация по-бързо и по-лесно.

Работата на тези специалисти предлага на компаниите предимство по отношение на време и усилия. Защото само с перфектно познаване на всички данни, които притежаваме, могат да се вземат обмислени и логически решения с най-големи шансове за успех.

Процес по висуализиране на данните

Източник Wikipedia

Историята на Джулия вече е доста често срещана, защото това е много търсена професионална фигура.

Експертите в анализа на данните, ИТ сигурността, изкуствения интелект и пазарния анализ все повече ще стават крайно необходим и ценен ресурс за компаниите.

Перспективите на професията

Пропуснах да дам дефиниция на Big Data. За да продължа по-нататък поправям грешката си:

Какво са Големите данни – Big Data

Нека помислим за ежедневните си действия: взаимодействия в социалните мрежи, кликване върху уебсайтове, свързвания със смартфони. Всичко това генерира невероятно голямо количество данни, много по-голямо, отколкото преди няколко десетилетия. Извънредни обеми на разнородни данни по източник и формат, които могат да бъдат анализирани в реално време: всичко това е Big Data. Три са основните характеристики: обем, скорост и разнообразие.

Разгледай LinkedIn, за да разбереш степента на увеличено търсене на професиите, свързани с Big Data. Напиши в критериите за търсене на работа думите „Data scientist„. Уменията на такъв професионалист са полезни в различни области.

За разлика от анализатора на данни, ученият работи с техники, които включват, но и надхвърлят традиционните статистически данни, защото също така разработва алгоритми за машинно обучение и изкуствен интелект.

отбелязва проф. Карлота Орсениго, директор на International Master in Business Analytics And Big Data на Училището по управление на Политехническия университет в Милано. Което подчертава интердисциплинарния характер на тази фигура, способна да използва данните, но също така и да разбере нуждите на бизнеса в сектора, в който оперира.

Приложения на науката за данните:

Интернет търсене: Търсачките използват алгоритми на науката за данни, за да доставят най-добри резултати в отговор на заявки за търсене за част от секунди.

Дигитални реклами: Целият дигитален маркетинг използва алгоритмите на науката за данните. Това е причината интернет рекламите да получават по-висок CTR от традиционните реклами.

Препоръчителни системи: Много компании използват тeзи системи, за да популяризират своите продукти и услуги в съответствие с интересите на потребителя и уместността на информацията. Препоръките се основават на предишните резултати от търсенето на потребителя.

Приложения на големите данни

Големите данни за финансовите услуги: Компаниите за кредитни карти, банките за търговия на дребно, частните консултантски услуги, застрахователните компании, рисковите фондове и институционалните инвестиционни банки използват големи данни за своите финансови услуги. Общият проблем сред тях е огромното количество мулти-структурирани данни, намиращи се в множество различни системи, които могат да бъдат решени с големи данни. Big Data се използват по няколко начина, като:

  • Анализ на клиенти
  • Анализ на съответствието
  • Анализ на измамите
  • Оперативен анализ

Големи данни в комуникациите: Придобиването на нови абонати, задържането на клиенти и разширяването на текущите абонатни бази са основни приоритети за доставчиците на телекомуникационни услуги. Решенията им са в способността да се комбинират и анализират масивите от генерирани от клиента данни, които се създават всеки ден.

Големи данни за търговията на дребно: Задържането на пазара и конкурентноспособността е резултат от оценката на клиента за обслужването. Това изисква способността да се анализират всички източници на данни по въпроса, включително блогове, данните за транзакциите на клиентите, социалните медии, данните за кредитните карти с търговска марка и данните на програмите за лоялност.

Приложения на анализа на данни

Здравеопазване: Основното предизвикателство за болниците със затягане на разходите е, да се лекуват толкова пациенти, колкото могат ефективно, като се има предвид подобряването на качеството на грижите. Данните се използват все повече за проследяване, както и за оптимизиране на потока от пациенти, лечение и оборудване, използвано в болниците.

Пътуване: Туристическите продукти могат да се продават чрез съпоставяне на текущите продажби с последващото преразглеждане чрез потребителски пакети и оферти. Персонализираните препоръки за пътуване могат да се предоставят и чрез анализ на данни, базиран на социалните медии.

Управление на енергията: Повечето фирми използват анализи на данни за управление на енергията, включително управление на интелигентни мрежи, енергийно оптимизиране, разпределение на енергия и автоматизация на сградите в комуналните компании. Приложението тук е съсредоточено върху контрола и мониторинга на мрежови устройства, изпращането на екипи и управлението на прекъсванията в обслужването. На комуналните услуги се дава възможност да интегрират милиони точки с данни в работата на мрежата и да позволяват на инженерите да използват анализите за наблюдението й.

Бъдещето на най-търсените IT професии

В ново проучване за работните места на бъдещето за развитието на сектора на информационните технологии (IT) до 2025 г., се поставя акцент именно върху голямата възможност за създаване на нови работни места, като се започне от новите умения и способности.

От резултатите от проучването, петте най-търсени ИТ профила до 2025 г. ще бъдат 54.6% експерти по големи данни, следвани от специалисти по ИТ сигурност (44.58%) и трети – разработчиците на приложения (26.10%) ), след това многоканални архитекти (24,90%) и интерактивни разработчици (23,29%).

Какво още поражда интерес към тези професии

Тези умения се заплащат доста добре. Според неотдавнашно проучване на обсерваторията на Big Data Analytics & Business Intelligence на Politecnico di Milano, средната начална заплата е около 30-35 хил. Евро бруто годишно и има тенденция да нараства значително със старшинство в ролята.

Средната стойност, която учените за данни печелят днес, според Indeed.com е $ 123,000 годишно. Според Glassdoor.com, средната заплата за Data Scientist е $ 113,436 на година.

Средната заплата на специалист по големи данни според Glassdoor.com е $ 62,066 годишно.

Средната заплата за анализатор на данни според Glassdoor.com е $ 60,476 на година.

За да се стигне до добро ниво в професията, е необходимо да имаме солидни аналитични знания, които могат да бъдат приписани на научни дисциплини като математика и физика, но също и на компютърните науки. А не трябва да се пренебрегват и управленските умения.

39% от интервюираните специалисти твърдят, че обновяват знанията си на всеки 6 месеца, докато 39,50% – дори на всеки 3 месеца.

Как се става Data Scientist

Data Scientist е мултидисциплинарна професия.
През 2012 г. Brendan Tierney разработва тази диаграма на Venn, в която ясно се появяват мултидисциплинарните отношения.

През 2016 г. Gartner представи тази схема, отново за да демонстрира мултидисциплинарния характер на темата и преди всичко факта, че Data Science се намира в пресечната точка на три бизнес дисциплини и че ще бъде много трудно да се намери човек, който е усвоил всички от тях. Много по-лесно е да се започне с основна компетентност, например в областта на статистиката или компютърните науки, а след това да се изградят другите върху създадената вече база.

В крайна сметка, диаграмите на Вен относно професията стават все по-сложни и се приближават до последната схема, която обобщава всички компетенции, които допринасят за един добър учен по данните.

Data Science Disciplines

Източник Wikibooks

И систематизираме:

Необходимите умения за учен на данни:

Образование: магистърска степен и докторанти.

По-задълбочени познания за SAS и / или R: За Data Science, обикновено се предпочита R.

Python кодиране: Python е най-разпространения език за кодиране, който се използва в науката за данните заедно с Java, Perl, C / C ++.

Платформа Hadoop: Въпреки че не винаги е необходимо, познаването на платформата Hadoop е все още предпочитана. Да имаш малко опит в Hive или Pig също е огромно предимство.

SQL база данни / кодиране: Въпреки че NoSQL и Hadoop са се превърнали в основна част от фона на Data Science, все още се предпочита да можеш да пишеш и изпълняваш сложни заявки в SQL.

Работа с неструктурирани данни: Най-важното е, Data Scientist да може да работи с неструктурирани данни в социални медии, видео или аудио потоците.

За да станеш професионалист в Big Data

Аналитични умения: Способност да разбираш смисъла на масивите данни, които получаваш. Кои данни са подходящи за решението на проблеми.

Творчество: Трябва да имаш способността да създаваш нови алгоритми за събиране, интерпретиране и анализиране на стратегия за данни. Това е много важно.

Математика и статистически умения: Изключително необходимо, било то в областта на науката за данните, анализа на данните или големите данни.

Компютърни науки: Има постоянна нужда да се разработват алгоритми за обработка на данни.

Бизнес умения: Специалистите по големи данни ще трябва да имат разбиране за съществуващите бизнес цели, както и за основните процеси, които стимулират растежа на бизнеса и неговата печалба.

За да станеш анализатор на данни

Умения за програмиране: R и Python са изключително важни за всеки анализатор на данни.

Статистически умения и математика: Дескриптивната и инференциалната статистика и експерименталните проекти са задължителни.

Умения за машинно обучение.

Умения за обработка на данни: Възможност за картографиране на суровите данни и превръщането им в друг формат, който позволява по-удобното им използване .

Умения за визуализация на комуникацията и данните.

Интуиция за данните: за професионалистите е изключително важно да могат да мислят като анализатор на данни.

Най-популярните сертификати за Big Data?

1. MCSE: Business Intelligence
2. Сертификати SAS
3. Data Mining and Applications Graduate Certificate
4. IBM Certified Solutions Advisor
5. Hortonworks
6. Hadoop сертифицирана Apache Spark
7. Сертифициран специалист по данни на Cloudera
8. Сътрудник на EMC Data Scientist (EMCDSA)

Заключение и ресурси

1. Read Sonia Ahluwalia‘s answer

2.

3. Блогове:

Brent Ozar, Denny Cherry, Greg Low, Kimberly L. Tripp, Paul S. Randal

Източници:

Businessinsider.com,

Bigdata4innovation.it

Simplilearn.com,

Източник на основното изображение Unsplash.com. LYCS Architecture


  •  

2 коментара

  1. Ziger

Коментари

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните ви за коментари.