Big Data масивите и облачните технологии ни дават лесен достъп до възможности, доскоро запазени за суперкомпютрите. Поверяваме на програми дейности, които вчера сме вършили сами.
Даже не се замисляме, че инструментите, с които обработваме тази приливна вълна от информация често имат някакъв фатален недостатък. Много от анализите ни се базират на порочни модели, в които грешките са неизбежни.
Когато прекомерните ни очаквания надминат способностите ни, последствията може да бъдат страшни.
Това нямаше да е такъв проблем, ако наистина нямахме пред себе си планини от данни, с които можем да достигнем до резултати - даже и по погрешен начин. Все по-често бъркаме това с някакво реално познание. Сляпо се влюбваме в технологиите и когато се стигне до издънка, ситуацията може да стане доста грозна.
За колко пари? За много пари!
Част от проблема са не толкова грешките на програмистите, колкото твърде опростените модели, на които те базират софтуера. Например, ако ви е трябвала фундаменталната за биологията на развитието книга The Making of a Fly на Питър Лаурънс, в началото на април 2011 г. в Amazon.com щяхте да видите следното: продават се 17 бройки, 15 нови с най-ниска цена от 35.34 долара и две нови за 23 698 655.93 долара (и доставка за още $3.99).
Действително, книгата е от 1992 г. и вече не се печата, но това никак не обяснява потресаващата цена. Тя е резултат от действията на две автоматизирани програми - на продавачите "bordeebook" и "profnath". Един път дневно „profnath" вдигал цената си до 99.83% от тази на „bordeebook". Няколко часа по-късно „bordeeebook" на свой ред повишавал своята цена до 127.06% от тази на конкурента. И така до 23 млн. долара за една книга.
Това е класически пример за това как неочаквани фактори могат да излъжат и най-добре подготвените компютърни модели. Това звучи ли ви като кризата с ипотеките в САЩ? Преди 2008 г. най-големите умове с най-добрата технология изпуснаха пропастта пред имотния пазар и твърде погрешно прецениха дълбочината й.
Запази спокойствие
Колкото по-мащабен е един модел, толкова повече възможности за грешка съдържа той. Изглежда очевидно, но все пак забравяме, че и най-добрите разчети не могат на 100% да предрекат реалността.
Ето друг пример. Един продавач на тениски в Amazon.co.uk имал в асортимента си и щампата „Keep Calm and Rape a Lot" ("Запази спокойствие и изнасилвай много"). Трудно е да определим това като особено умна идея, най-меко казано.
Solid Gold Bomb, компанията-производител, се извини, свали тениската от сайта, но и обяви, че тя въобще се е появила там „заради малка техническа грешка". Тениските се печатат по заявка, а щампите не са мислени от човек, а от компютърна програма. В нея били въведени думи и изрази (като популярния с вариациите си „Keep Calm and Carry On"), които после се поставяли върху изображение на дрехата, което автоматично се качвало в Amazon.
Компанията просто не обърнала внимание на една дума от 4000 в базата данни. За щастие, други обидни комбинации не стигнали до потенциалните клиенти.
Отново говорим за прост модел със сериозни социални последици. Софтуерът не разбира какъв е социалният контекст на думата „изнасилвай", нито какъв е целият бизнеспроцес около тениската. Недоглеждането се превръща в удар по фирмената репутация. Програмите не са хора - взаимодействието им с друг софтуер е напълно непредвидимо, реакциите на средата, в която работят - също.
Повече внимание
Горните два примера са само два начина да работим с порочен модел. Big Data все още има своите големи проблеми - например, все още събираната информация не е напълно нормализиране (т.е. случва се да сравняваме ябълки и круши), липсват подробни тестове и сравнения - виждаме какви проблеми среща Klout като инструмент за измерване на влиянието в социалните мрежи. Най-лошото е, че данните остават зазидани в сървърите на големите компании.
Въпреки това, естествено, не можем да кажем, че технологиите са обречени. Повечето от приложенията, които използваме във всекидневието си, работят извънредно добре. В някои случаи те наистина подобряват живота ни. Трябва обаче да изследваме моделите, на които се основават те. Защото един ден те могат да ни предадат.