Scenariusz dla branży data science w 2023 roku

Scenariusz dla branży data science w 2023 roku

W najbliższych miesiącach legislatorzy skoncentrują się na kwestii praw autorskich, które dotyczą zbiorów używanych do trenowania algorytmów uczenia maszynowego. Przyjrzą się też kwestii otwartości danych. Z kolei organizacje staną przed koniecznością dostosowania rozwiązań do kształtujących się regulacji. Dodatkowo, zależnie od branży, zmierzą się z koniecznością analizy danych w czasie rzeczywistym, modelowaniem wirtualnej rzeczywistości oraz poszukiwaniem ekspertów wyspecjalizowanych w analizie danych medycznych.

Przedsiębiorstwa z roku na rok wytwarzają coraz więcej danych, czego nie można ignorować, decydując się na prowadzenie działalności gospodarczej. Eksploracja danych na temat procesów biznesowych i odkrywanie wzorców zachowań klientów stanowią klucz do sukcesu rynkowego. Rozwój e-commerce sprawił, że dane spływają z wielu źródeł: klient może zarówno odwiedzać stacjonarną placówkę sklepu, jak i robić zakupy w aplikacji mobilnej czy na stronie internetowej. Analiza takich informacji, jak historia zakupów bądź upodobania danej osoby, jest już standardem. Teraz wyzwaniem dla analityków, działów IT i właścicieli lub menadżerów firm stało się wykorzystanie danych tu i teraz poprzez badanie zachowań konkretnych osób oraz grup konsumentów, aby w najwłaściwszym momencie zaproponować im produkty i usługi.

Wychwycenie właściwych sygnałów z szumu jest możliwe, o ile przepływ informacji w organizacji działa dobrze i został zsynchronizowany z procedurami. To niełatwe, ponieważ często wymaga transformacji całego przedsiębiorstwa. Niekorzystnym zjawiskiem, na które szczególnie trzeba zwrócić uwagę, są tzw. silosy danych, czyli obszary, które przetwarzają informacje tylko we własnym zakresie i nie dzielą się nimi z innymi częściami organizacji. Silosy stoją często na drodze pomiędzy klientem a odpowiednio szybką reakcją. W najbliższym czasie możemy spodziewać się, że likwidowanie silosów danych i wprowadzanie kultury organizacyjnej skupionej na prawidłowym korzystaniu z informacji będzie istotnym elementem różnicującym firmy, czy to w kwestii zysku, czy lojalności klientów.

Będą nowe przepisy

W 2022 roku głośnym echem w mediach odbiły się informacje na temat algorytmów przetwarzania obrazów oraz tekstów. Sztuczna inteligencja na podstawie słów kluczowych tworzy ilustracje, które trudno odróżnić od prac zawodowych grafików, a także teksty, które po sprawdzeniu i przeredagowaniu można udostępnić na firmowym blogu. Artyści i copywriterzy mają uzasadnione podstawy do obaw, że w przyszłości algorytmy przejmą ich rolę. Zagrożone mogą być szczególnie te obszary działalności, które nie są zbyt wymagające. Generatory tekstu, jak ChatGPT OpenAI, już teraz nie najgorzej sprawdzają się w podobnych zadaniach — tworzą opisy produktów, a generatory grafik w ciągu kilku sekund są w stanie zaproponować ilustracje do książek lub gier planszowych.

Wątpliwości jednak budzą kwestie praw autorskich do tego typu utworów, co będzie przedmiotem debat wśród przedstawicieli szeroko pojętej branży kreatywnej oraz polityków. Chociaż sprawa nie doczekała się jeszcze oficjalnego stanowiska Parlamentu Europejskiego, ani amerykańskiego Kongresu, możemy się spodziewać, że prędzej czy później pojawią się odpowiednie regulacje w zakresie wykorzystania zbiorów do trenowania algorytmów. Wyzwaniem dla ekspertów data science i organizacji będzie śledzenie nowych przepisów i samych projektów, by szybko reagować na potencjalne zmiany i dostosowywać swoje rozwiązania. Brak działań z wyprzedzeniem może prowadzić do zamykania innych projektów.

Demokratyzacja data science?

Demokratyzacja data science to kolejny aspekt, w którym regulatorzy, mając na względzie konkurencyjność zachodniej gospodarki, odegrają ważną rolę. Tempo rozwoju zależy m.in. od wiedzy, analizy danych i zaawansowania algorytmów uczenia maszynowego. Aby utrzymać je na odpowiednim poziomie, trzeba zbudować otoczenie prawne, które zapewnia większy dostęp do otwartych zbiorów danych. Także przedsiębiorcy coraz częściej zdają sobie sprawę z faktu, że przewagi konkurencyjnej nie da się osiągnąć, jeśli chronią swoje dane i algorytmy za wszelką cenę, bo sukces zależy od otwarcia się na nowe rozwiązania i pomysły. Jak wynika z badań instytutu McKinseya, organizacje, które udostępniają dane wszystkim swoim pracownikom, 40 razy częściej dochodzą do przekonania, że analityka ma pozytywny wpływ na zysk.

Zaawansowana analiza obrazów na potrzeby VR i AR

Wspomniane wcześniej generowanie obrazów na podstawie słów kluczowych to dopiero początek tego, do czego może w przyszłości zostać wykorzystane uczenie maszynowe. Kolejnym etapem rozwoju tej dziedziny będzie zaprzęgnięcie algorytmów do tworzenia realistycznych scen 3D na podstawie dwuwymiarowych zdjęć i obrazów. Wyzwaniem dla programistów i inżynierów data science w tym obszarze będzie opracowanie narzędzi do używania modeli generowanych w ten sposób — w urządzeniach wirtualnej i rozszerzonej rzeczywistości. Pierwsze rozwiązania tego typu już istnieją. Warto wspomnieć algorytm NeRF (ang. Neural Radiance Field) opracowany przez naukowców z UC Berkeley oraz UC San Diego we współpracy z Google Research. Narzędzie pozwala na tworzenie modeli 3D na podstawie serii dwuwymiarowych zdjęć i jest dostępne w serwisie GitHub, a przykładowe zastosowania można obejrzeć na stronie projektu.

Poszukiwani bioinformatycy

W ostatnich miesiącach wyraźnie rośnie zapotrzebowanie na ekspertów w zakresie bioinformatyki. Ta dziedzina pozostaje jedną z najbardziej innowacyjnych i perspektywicznych, a analiza danych medycznych może przynieść korzyści zarówno firmom z sektora medycznego, jak i pacjentom. Z danych zebranych przez Foote Partners wynika, że w ostatnich miesiącach 2022 roku na rynku pojawiło się bardzo duże zapotrzebowanie na ekspertów specjalizujących się w dziedzinie bioinformatyki. Zarobki specjalistów tej branży w ciągu zaledwie pół roku wzrosły prawie o 19%. Według szacunków Acumen Research and Consulting, sektor bioinformatyki wart jest obecnie ponad 12 miliardów dolarów, a do 2030 roku przekroczy wartość 46 miliardów dolarów. Największy rozwój tej dziedziny widać w Stanach Zjednoczonych. Zastosowanie algorytmów sztucznej inteligencji do analizy danych medycznych pomoże opracowywać nowe leki i terapie, a także diagnozować choroby na wczesnym etapie rozwoju, dzięki czemu lekarze będą mogli skuteczniej leczyć pacjentów.

Warto przy tym odnotować, że poszukiwanie ekspertów oraz odpowiednie przydzielenie ról w zespołach data science to wyzwanie nie tylko bioinformatyczne. W najbliższym czasie będą się z nim borykały wszystkie organizacje, które dążą do efektywnego wykorzystania danych.

Udostępnij link

https://www.datasciencerobie.pl/scenariusz-dla-branzy-data-science-w-2023-roku/