SAS: jak usprawnić procesy machine learning

Uczenie maszynowe zrewolucjonizowało analitykę, umożliwiając podejmowanie dokładniejszych decyzji biznesowych w oparciu o dane. Technologia ta pozwala na rozwiązywanie wielu problemów, na które tradycyjne techniki analityczne nie były w stanie znaleźć odpowiedzi.

Dlaczego firmy wciąż jednak nie potrafią wykorzystać w pełni potencjału uczenia maszynowego? Wiele z nich popełnia jeden z 5 błędów, wskazanych niżej przez ekspertów firmy SAS.

Uczenie maszynowe (machine learning) to metoda samouczenia się maszyn w oparciu o analizę danych i odnajdywanie zawartych w nich wzorców. Jak wynika z danych IDC, w najbliższych latach uczenie maszynowe będzie odgrywało coraz większą rolę w strategii rozwoju biznesu.

http://branden.biz/index.php/2018/01/14/biznes-bez-wyjscia-rzadzi-analityka-predykcyjna-i-machine-learning/

Firma prognozuje, że w 2020 wydatki przedsiębiorstw związane z implementacją machine learning i sztucznej inteligencji wyniosą aż 47 miliardów USD. Oznacza to ponad pięciokrotny wzrost w stosunku do 2016.

Wokół technologii uczenia maszynowego urosło wiele mitów i niektórzy zaczęli uznawać ją za lek na wszelkie problemy, jakie spotykają współczesny biznes. W rzeczywistości jednak wiele zależy od tego, jak będziemy wykorzystywali to rozwiązanie.

5 błędów, które uniemożliwiają organizacjom wykorzystanie pełni potencjału uczenia maszynowego:

  1. Planowanie strategii machine learning bez wsparcia ekspertów (data scientists)

Niedobór talentów analitycznych staje się wyzwaniem dla całej branży. Dostęp do wykwalifikowanych pracowników można zapewnić sobie np. poprzez zbudowanie relacji z uczelniami i wprowadzenie programu stażowego lub programu rekrutacji uniwersyteckiej, który będzie szansą na pozyskanie specjalistów. Niezwykle istotne jest również rozwijanie talentów wewnątrz firmy oraz ułatwianie dostępu do danych innym pracownikom.

  1. Brak odpowiednich danych

Zanim zaczniemy myśleć o wdrożeniu rozwiązań z zakresu machine learning, powinniśmy przygotować, zintegrować i sprawdzić dane, którymi dysponujemy. Słabe jakościowo dane możemy podzielić na następujące grupy:

  • „Zaszumione dane” – zawierają dużą liczbę sprzecznych lub wprowadzających w błąd informacji,
  • „Brudne dane” – niosą za sobą liczne braki danych, zmienne kategoryczne o bardzo dużej liczbie możliwych wartości, a także niespójne i błędne wartości (np. wynikające z awarii urządzeń pomiarowych),
  • „Rzadkie dane” – posiadają niewiele wartości zawierających faktyczne informacje, w większości składają się z zerowych lub brakujących wartości,
  • „Niekompletne dane” – są zbyt mało liczne lub niereprezentatywne.
  1. Brak odpowiedniej infrastruktury

Uczenie maszynowe wiąże się z potrzebą przeprowadzania skomplikowanych obliczeń, co z kolei wymaga odpowiedniego sprzętu, m.in. dysków SSD. Infrastruktura wykorzystywana przez przedsiębiorstwo powinna być na tyle elastyczna, aby umożliwiała optymalne wykorzystanie mocy obliczeniowej oraz rozbudowę pamięci masowej. W niektórych przypadkach decyzja o wdrożeniu uczenia maszynowego może wiązać się potrzebą rozbudowy infrastruktury, gdyż pierwotne zasoby mogą przestać sprawnie działać pod naporem gromadzonych danych.

  1. Brak strategii wdrożenia

Wybór odpowiedniego momentu, w którym należy zastosować nowsze, bardziej kompleksowe metody analityczne stanowi duże wyzwanie dla każdej organizacji. Wykorzystanie uczenia maszynowego nie zawsze jest koniecznie. Wszystko zależy od tego, jakie jest aktualne zapotrzebowanie na usługi IT w danym biznesie. Przykłady firm, które wykorzystują uczenie maszynowe, pokazują, że technologia ta może być pomocna w takich procesach jak wykrywanie anomalii i oszustw w branży finansowej, czy automatyzacja procesów scoringu kredytowego lub działań marketingowych.

  1. Problemy z interpretacją modeli metodologicznych uczenia maszynowego

Istotą algorytmów uczenia maszynowego jest ich złożoność. Z jednej strony umożliwiają one przeprowadzanie samodzielnych analiz, ale z drugiej mogą być trudne do zrozumienia. Rozwiązaniem niektórych problemów z interpretacją może być zastosowanie strategii hybrydowej, połączenia tradycyjnych metod analitycznych i uczenia maszynowego.

Aby w pełni zrozumieć i wykorzystać potencjał uczenia maszynowego niezbędne jest poznanie szerszego środowiska analitycznego oraz sprawdzonych przykładów z innych firm. Organizacje, które zdecydują się na wdrożenie machine learning muszą przygotować się na liczne wyzwania. Sprostanie im pozwoli na uzyskanie przewagi rynkowej dzięki automatyzacji procesów analitycznych, którą umożliwia technologia uczenia się maszyn.