Data science – co to jest?

Data science, czyli nauka o danych, inaczej danologia.

Co to jest nauka o danych?

Nauka o danych to dziedzina nauki, która łączy wiedzę fachową, umiejętności programowania oraz znajomość matematyki i statystyki, aby wydobyć znaczące wnioski z danych. Praktycy nauki o danych stosują algorytmy uczenia maszynowego do liczb, tekstu, obrazów, wideo, audio i nie tylko, aby tworzyć systemy sztucznej inteligencji (AI) do wykonywania zadań, które zwykle wymagają ludzkiej inteligencji. Z kolei systemy te generują insighty, które analitycy i użytkownicy biznesowi mogą przełożyć na wymierną wartość biznesową.

 

Dlaczego analiza danych jest ważna?

Coraz więcej firm zdaje sobie sprawę, jak ważna jest nauka o danych, sztuczna inteligencja i uczenie maszynowe. Niezależnie od branży czy wielkości, organizacje, które chcą pozostać konkurencyjne w dobie big data, muszą skutecznie rozwijać i wdrażać możliwości analizy danych lub ryzykować pozostanie w tyle.

Fundamenty

Data science to interdyscyplinarna dziedzina skupiająca się na wydobywaniu wiedzy z zestawów danych, które zazwyczaj są duże oraz stosowaniu wiedzy i praktycznych spostrzeżeń z danych do rozwiązywania problemów w szerokim zakresie dziedzin aplikacji. Dziedzina obejmuje przygotowywanie danych do analizy, formułowanie problemów związanych z nauką o danych, analizowanie baz danych, opracowywanie rozwiązań opartych na danych oraz przedstawianie wyników w celu podejmowania decyzji na wysokim poziomie w szerokim zakresie dziedzin aplikacji. Jako taki obejmuje umiejętności z zakresu informatyki, statystyki, informatyki, matematyki, wizualizacji informacji , integracji danych, projektowania graficznego, złożonych systemów , komunikacji i biznesu. Statystyk Nathan Yau, opierając się na Ben Fry, również łączy naukę danych z interakcją człowiek-komputer: użytkownicy powinni być w stanie intuicyjnie kontrolować i eksplorować dane. W 2015 roku Amerykańskie Stowarzyszenie statystyczne zidentyfikowane zarządzania bazami danych , statystyk i uczenie maszynowe , a dystrybuowane i systemy równoległe jak trzech fundamentalnych powstających wspólnot zawodowych. 

Nowoczesne zastosowanie

Współczesną koncepcję nauki o danych jako niezależnej dyscypliny przypisuje się czasami Williamowi S. Clevelandowi. W artykule z 2001 roku opowiadał się za rozszerzeniem statystyki poza teorię na obszary techniczne; ponieważ to znacznie zmieniłoby dziedzinę, uzasadniało to nową nazwę. „Nauka o danych” stała się szerzej stosowana w ciągu kilku następnych lat: w 2002 r. Komitet ds. Danych dla Nauki i Technologii wydał Data Science Journal. W 2003 roku Columbia University uruchomiła The Journal of Data Science. W 2014 roku Amerykańskie Stowarzyszenie Statystyczne, Sekcja Statistical Learning i Data Mining zmieniła nazwę na Sekcja Statistical Learning and Data Science, odzwierciedlając rosnącą popularność data science.

Tytuł zawodowy „naukowca danych” została nadana DJ Patil i Jeff Hammerbacher w 2008 roku. Mimo że był używany przez Krajową Radę Nauki w swoim raporcie za rok 2005, „długowieczny cyfrowych zbiorów danych: Włączenie badań i edukacji w XXI wieku” odnosił się szeroko do jakiejkolwiek kluczowej roli w zarządzaniu cyfrowym gromadzeniem danych. 

Wciąż nie ma zgody co do definicji nauki o danych i niektórzy uważają ją za modne hasło.

 Zapoznaj się także z artykułami dotyczącymi takich tematów jak: generowanie leadów, call center, strategie marketingowe. 

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>