Случаи за използване на блокчейн и големи данни: предизвикателства и възможности с блокчейн и наука за данни?

Blockchain и Big Data са сред най -нововъзникващите технологии, насочени към революция в няколко индустрии, коренно променящи начина на управление на бизнеса и организациите. Може да се предположи, че тези технологии се изключват взаимно – всяка изковава уникални пътища и се прилага независимо един от друг.

Но това ще бъде необичайно.

Блокчейнът – също като науката за данните – постепенно трансформира начина, по който функционират няколко индустрии. И докато науката за данните се фокусира върху използването на данни за правилното администриране, блокчейнът гарантира доверие на данните, като поддържа децентрализирана книга.

Въпросът е, Има ли място, където тези две концепции да бъдат прихванати?

Какво ще се постигне, когато тези две технологии се прилагат едновременно?

Просто казано, как блокчейнът може да наруши науката за данните?

За да отговорите на тези въпроси, ще бъде полезно да получите по -добро разбиране на блокчейн и наука за данни отделно един от друг.

Какво е блокчейн?

Блокчейнът е по същество недоверена книга, която записва икономически транзакции, така че те не могат да бъдат манипулирани. Технологията стана известна в резултат на интереса към биткойн и криптовалутата като цяло, но оттогава намери значение за записването не само на транзакции с криптовалута, но и на нещо ценно. Знаейки възможностите на тази нововъзникваща технология, разработчиците и технологичните ентусиасти са се заели с разработването на случай на използване след случай на използване на блокчейн.

Високо търсене за разработчици на блокчейн

Търсенето на разработчици на блокчейн се увеличи през последните няколко години точно както проектите, работещи върху различни приложения на блокчейн. Докладите от платформи на свободна практика като UpWork запазват блокчейн уменията като най -търсените умения. По подобен начин се казва, че професионалистите в други области като Правни изследвания имат голямо предимство, ако имат умения за блокчейн – или поне разбират технологията.

Какво е Data Science?

Науката за данни се стреми да извлече знания и прозрения от структурирани и неструктурирани данни. Това поле обхваща статистика, анализ на данни, машинно обучение и други усъвършенствани методи, използвани за разбиране и анализ на действителните процеси с помощта на данни.

Данните често се описват като ново петрол на икономически език, причина водещите фирми, включително известните GAFA (Google, Amazon, Facebook и Apple) да контролират много данни. Някои често срещани приложения на науката за данните се виждат в протоколи на интернет двигатели, дигитални реклами и препоръчителни услуги. Анализът на данни, ключов аспект на науката за данни, е намерен за подходящ в индустрията на здравеопазването за проследяване на лечението на пациентите и потока от оборудване; при пътуване с игри за подобряване на потребителското изживяване; за управление на енергията, както и много други сектори.

Високо търсене на изследователи на данни

Има и привидно ненаситно търсене на учени по данни, които могат да предоставят повече информация за данните и да помогнат за решаването на повече проблеми. Това е още по -ясно изразено при разглеждане на големи данни, напреднал аспект на науката за данни, който се занимава с изключително големи количества данни, които не могат да бъдат обработвани чрез традиционните методи за обработка на данни.

Връзката между Blockchain и Data Science

За разлика от области като Fintech, здравеопазване и верига на доставки, където блокчейнът вече е много познат, технологията не е изследвана широко в аспекти на науката за данните. За някои отношенията между понятията са неясни, ако не липсват.

Като начало, както блокчейн, така и науката за данни се занимават с данни – науката за данни анализира данните за прозрения, които могат да бъдат изпълнени, докато блокчейнът записва и валидира данните. И двете използват алгоритми, създадени за управление на взаимодействията с различни сегменти от данни. Често срещана тема, която скоро ще забележите, е тази, „Наука за данни за прогнозиране; блокчейн за целостта на данните. “

Въздействие на блокчейн върху данните

Науката за данните, както всеки технологичен напредък, има свои собствени предизвикателства и ограничения, които, когато бъдат адресирани, ще разгърнат пълните й възможности. Някои големи предизвикателства пред науката за данните включват недостъпни данни, проблеми с поверителността и мръсни данни.

Контролът на мръсни данни (или грешна информация) е една област, в която технологията на блокчейн може да повлияе положително на областта на науката за данните в немалка степен. Според проучване от 16 000 специалисти по данни от 2017 г. включването на мръсни данни като дублирани или неправилни данни е определено като най -голямото предизвикателство за науката за данните. Чрез децентрализиран алгоритъм за консенсус и криптография, блокчейнът валидира данните, което прави почти невъзможно да бъдат манипулирани поради огромното количество изчислителна мощ, която ще бъде необходима.

Отново чрез своята децентрализирана система, блокчейн технологията гарантира сигурността и поверителността на данните. Повечето данни се съхраняват в централизирани сървъри, които често са мишена на кибератаки; няколкото съобщения за хакове и нарушения на сигурността показват степента на заплахата. Blockchain, от друга страна, възстановява контрола върху данните на лицата, генериращи данните, което го прави трудна задача за киберпрестъпниците да имат достъп и манипулират данни в голям мащаб.

Как блокчейнът може да помогне за големи данни?

Ако количеството е голямо, казва Мария Вайнбергер от Janexter, блокчейнът е качеството. Това следва разбирането, че блокчейнът е фокусиран върху валидиране на данни, докато науката за данни или големите данни включват прогнози от големи количества данни.

Блокчейнът въведе изцяло нов начин за управление и работа с данни – вече не в централна перспектива, където всички данни трябва да бъдат обединени, а в децентрализиран начин, при който данните могат да бъдат анализирани непосредствено от ръбовете на отделните устройства. Блокчейнът се интегрира с други напреднали технологии, като облачни решения, изкуствен интелект (AI) и Интернет на нещата (IoT).

Освен това валидираните данни, генерирани чрез блокчейн технологията, са структурирани и пълни, плюс факта, че са неизменни, както споменахме по -рано. Друга важна област, в която генерираните от блокчейн данни се превръщат в тласък за големи данни, е целостта на данните, тъй като блокчейнът установява произхода на данните чрез свързаните си вериги.

5 случая на използване на блокчейн в големи данни

Има поне пет конкретни начина, по които блокчейн данните могат да помогнат на учените по данни като цяло.

  • Осигуряване на доверие (целостта на данните)

Данните, записани в блокчейна, са надеждни, защото те трябва да са преминали през процес на проверка, който гарантира неговото качество. Той също така осигурява прозрачност, тъй като могат да бъдат проследени дейности и транзакции, които се извършват в блокчейн мрежата.

Миналата година Lenovo показа този случай на използване на блокчейн технология за откриване на измамни документи и формуляри. Компютърните гиганти използваха технологията блокчейн за валидиране на физически документи, кодирани с цифрови подписи. Цифровите подписи се обработват от компютри и автентичността на документа се проверява чрез блокчейн запис.

В повечето случаи целостта на данните се осигурява, когато подробности за произхода и взаимодействията, свързани с блок данни, се съхраняват в блокчейна и автоматично се проверяват (или валидират), преди да може да се действа.

  • Предотвратяване на злонамерени дейности

Тъй като блокчейнът използва консенсусен алгоритъм за проверка на транзакциите, е невъзможно едно -единствено устройство да представлява заплаха за мрежата за данни. Възел (или единица), който започва да действа необичайно, може лесно да бъде идентифициран и изтрит от мрежата.

Тъй като мрежата е толкова разпределена, прави почти невъзможно една страна да генерира достатъчно изчислителна мощност, за да промени критериите за валидиране и да позволи нежелани данни в системата. За да се променят правилата за блокчейн, по -голямата част от възлите трябва да бъдат обединени заедно, за да се създаде консенсус. Това няма да е възможно за един лош актьор да постигне.

  • Правене на прогнози (прогнозен анализ)

Данните за блокчейн, както и другите видове данни, могат да бъдат анализирани, за да разкрият ценна информация за поведението, тенденциите и като такива могат да се използват за прогнозиране на бъдещи резултати. Нещо повече, блокчейнът предоставя структурирани данни, събрани от физически лица или отделни устройства.

При прогнозния анализ учените по данни се основават на големи набори от данни, за да определят с добра точност резултата от социални събития, като предпочитанията на клиентите, стойността на живота на клиента, динамичните цени и процентите на отпадъци, що се отнася до бизнеса. Това обаче не се ограничава до бизнес прозрения, тъй като почти всяко събитие може да се предвиди с правилния анализ на данните, независимо дали става въпрос за социални настроения или инвестиционни маркери.

И поради разпределения характер на блокчейн и огромната изчислителна мощ, достъпна чрез него, учените по данни дори в по -малки организации могат да се заемат с обширни задачи за предсказуем анализ. Тези учени могат да използват изчислителната мощ на няколко хиляди компютри, свързани в блокчейн мрежа като облачна услуга, за да анализират социалните резултати в мащаб, който иначе не би бил възможен.

  • Анализ на данни в реално време

Както е изложено във финансови и платежни системи, блокчейнът прави трансгранични транзакции в реално време. Няколко банки и финтех иноватори сега проучват блокчейн, защото той позволява бързо-всъщност, в реално време-уреждане на огромни суми, независимо от географските бариери.

По същия начин организациите, които се нуждаят от мащабен анализ на данни в реално време, могат да се обърнат към система с активирана блокчейн за постигане. С блокчейн банките и други организации могат да наблюдават промени в данните в реално време, което прави възможно вземането на бързи решения – независимо дали става въпрос за блокиране на подозрителна транзакция или проследяване на необичайни дейности.

  • Управление на споделянето на данни

В тази връзка получените данни от формуляри за данни могат да се съхраняват в блокчейн мрежа. По този начин екипите по проекта не повтарят анализ на данни, вече извършен от други екипи, или неправомерно използват повторно използваните данни. Също така, блокчейн платформата може да помогне на учените за данни да осигуряват приходи от работата си, вероятно чрез резултатите от търговския анализ, съхранявани в платформата.

Заключение

Както беше отбелязано, блокчейнът е в начален стадий, въпреки че може да не изглежда така поради шумотевицата, която технологията е набрала за кратък период. Човек би могъл да очаква, че с напредването на технологията и появата на повече иновации около нея ще бъдат идентифицирани и проучени по -конкретни случаи на използване – науката за данните е една област, която ще се възползва от това.

Като се има предвид това, бяха повдигнати няколко предизвикателства относно влиянието му върху науката за данните, особено в големите данни, което изисква изключително големи количества данни за обработка. Едно от притесненията е, че прилагането на блокчейн в това отношение ще бъде много скъпо за преследване. Това е така, защото съхранението на данни в блокчейн е скъпо в сравнение с традиционните средства. Блоковете се занимават със сравнително малки количества данни в сравнение с големите обеми от данни, събрани в секунда за големи данни и други задачи за анализ на данни.

Начинът, по който блокчейнът се развива, за да отговори на тези опасения и да продължи да нарушава пространството за наука за данни, ще бъде особено интересно, защото, както видяхме, технологията има огромен потенциал да промени начина, по който управляваме и използваме данни.