Безопасность в социальных сетях
В конце
cовместный спецпроект постнауки
и университета иннополис о больших данных
кандидат физико-математических наук, МФТИ, программист компании Parallels
Большие данные — это совокупность технологий, которые призваны совершать три операции.
Наука о данных занимается извлечением знаний и значимой информации из крупных и сложных массивов данных. Извлечение информации выводит скрытые закономерности, спрятанные в данных, и позволяет лучше понимать данные. В этом значимость науки о данных. Она соединяет знания с реальностью. Она преобразует онлайновые знания в оффлайновые. Она меняет нашу жизнь, стратегии бизнеса, подход к выбору и помогает другим наукам технологии и социологическим исследованиям.
Твиттер — отличный пример массивной динамической диаграммы. У Твиттера ежемесячно более 284 миллионов активных пользователей. Они размещают более 500 миллионов твитов в день. Отношения и общение между пользователями создают массивные динамические диаграммы, которые сложно не только понять, но даже визуализировать.
Одно из решений этой проблемы — обобщить данные. Это позволяет понять, как информация распространяется в системе, и какие пользователи — самые интересные и важные в процессе общения. Если определить важных пользователей, можно, например, остановить вирус, если таковой распространяется по системе, можно рекламировать товары в системах Твиттера, можно разобраться, как люди воспринимают информацию в онлайновые часы и чем это непохоже на оффлайновые часы. Одна из важнейших задач в этой области — понять миры онлайна и оффлайна.Например, данные того же хостинга YouTube, которые переливаются по сети в обе стороны. Под обработкой понимается не только интерпретация, но и возможность правильно обработать каждое из этих действий, то есть поместить его в нужное место и сделать так, чтобы эти данные каждому пользователю были доступны быстро, поскольку социальные сети не терпят ожидания.
Читать далееАнализ социальных сетей — одна из самых популярных тем для исследований в наши дни. Если взять охват аудитории всех сайтов с социальными сетями, то мы увидим, что они привлекли самое большое число пользователей за всю историю интернета. Это означает, что у нас в руках огромное количество информации об активности людей в социальных сетях, равно как и об их структуре. Поэтому мы, люди, занимающиеся исследованиями, ищем пути такого использования этого большого количества данных, который дал бы нам возможность разобраться в них.
Нам всем знакомы понятия «доверие» и «репутация». Доверие — это то, что необходимо для принятия того или иного решения. Без доверия вы не отдадите деньги банку. В социальных сетях пользователи делятся очень многим. Очевидно, что им не хотелось бы делиться личными вещами, такими как фото, с людьми, которым они не доверяют. Исследователи пытаются найти способ вычисления репутации друзей и прочих людей, с которыми мы связаны в социальных сетях, чтобы иметь возможность делиться личными данными и информацией лишь с теми, кому мы доверяем. Именно для этого ученые работают над вычислением репутации.
Читать далееВ конце
Корпорации принципиально отличаются компаний, и прежде всего, размером. Второе – это распределенность, ведь, как правило, корпорация – это не один офис, а географически разные точки, которые чем-то между собой связаны. И третье – это диверсификация, то есть речь идет не об одном виде бизнеса. Возьмем Microsoft: они создают и продают программное обеспечение, но и есть специальная компания Microsoft Research, которая занимается исследованием перспективных направлений деятельности. Для корпораций необходимы средства информационной поддержки, для ведения на разных уровнях: это и учет, и планирование, и управление, и прогнозы. Для этого и создают корпоративные системы.