Науки о данных и кибербезопасность — популярные мифы

Наука о данных — это область, которая в настоящее время все чаще используется в проблемах, которые до недавнего времени все еще были очень трудными для решения. Без правильных алгоритмов интеллектуального анализа данных и машинного обучения было бы трудно представить такие задачи, как распознавание изображений, речи, рукописного ввода или жестов. Помимо этих флагманских примеров, работа ученых-исследователей данных все чаще используется для решения конкретных бизнес-задач, в том числе в области кибербезопасности.

Однако из-за того, что только в последние годы широко известный анализ данных приобрел популярность в борьбе с киберпреступниками, многие мифы возникли вокруг этой дисциплины. Несколько, на наш взгляд, самых главных, которые мы обсудим в этой статье.

Предиктивные системы способны обнаруживать любую атаку

Многие компании используют достижения в области данных для создания прогностической системы, способной обнаруживать, когда произойдет следующая сетевая атака. Такие системы позволяют значительно снизить угрозу атаки и стать важной защитой. Однако они не обеспечивают 100% -ной эффективности.

Они учатся обнаруживать атаки с использованием данных из прошлого, а это означает, что при появлении нового типа атаки возможно, что она не будет обнаружена. Хакеры также постоянно приспосабливаются и изменяют свою стратегию, чтобы перехитрить безопасность. Это работает в ущерб прогностическим системам, которые не могут быстро адаптироваться к изменениям.

Эффективность системы прогнозирования всегда одинакова

В отличие от других областей, где используется машинное обучение, качество предсказательных моделей относительно быстро падает в кибербезопасности. На них влияют постоянно изменяющиеся угрозы и вышеупомянутая хакерская активность при корректировке стратегии атаки. В случае традиционных приложений, таких как распознавание рукописного ввода или лица на изображениях, проблема не меняется со временем, поэтому качество системы остается на одном уровне в течение длительного времени. В области кибербезопасности, чтобы преодолеть снижение эффективности, необходимо работать с данными и частыми обновлениями прогнозирующих моделей.

Система сетевой безопасности может полагаться только на прогностическую модель

Алгоритмы машинного обучения требуют большого объема данных для получения правильной степени обобщения задачи. В случае защиты от сетевых атак это данные о правильном сетевом трафике и об угрозах. Иногда, однако, угрозу очень трудно регистрировать, поэтому научная интеллектуальная модель не научится отличать ее от обычного сетевого трафика.

В таких ситуациях лучше использовать другой метод, основанный, например, на хешах, масках и т. д. Методы вне области машинного обучения также могут использоваться в качестве дополнительного начального уровня безопасности. Такая комбинация часто дает очень хорошие результаты, и нельзя отказаться от традиционных методов только для прогнозирующих моделей.

Предиктивные системы заменят работу сетевых аналитиков

Хотя теперь все громче и громче о замене работы людей алгоритмами, вы не должны бояться, что прогностические системы полностью заменят сетевых аналитиков. Область кибербезопасности динамична, почти каждый день появляются новые методы атак, требующие анализа, правильной обработки, а затем выражения их в форме правил принятия решений или прогнозирующих моделей.

Вместо замены людей автоматизированные системы безопасности скорее дополнят работу аналитиков, позволяя им сосредоточиться на новых или самых сложных случаях. В связи с нехваткой квалифицированных специалистов в области кибербезопасности стратегия сотрудничества между людьми и машинами определенно повысит общую эффективность защиты.

Алгоритмы важнее данных

Этот миф связан не только с областью кибербезопасности, но и применим к каждой дисциплине, в которой используется машинное обучение. Часто в статьях о приложениях машинного обучения подчеркивается важность алгоритма, не говоря уже о данных. Между тем, вы можете использовать лучшие алгоритмы обучения, но без достаточного количества высококачественных данных модель не будет эффективной.

Фокусирование в основном на алгоритме вместо данных можно сравнить с покупкой автомобиля без возможности доступа к АЗС. Поэтому при реализации предсказательной модели помните, что набор данных, используемый во время обучения, по крайней мере так же важен, как и алгоритм.

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>