Реальність ШІ в кібербезпеці

12. Квітень 2021

Існує багато галасу про використання штучного інтелекту (ШІ) у сфері кібербезпеки. Правда полягає в тому, що роль і потенціал штучного інтелекту в безпеці все ще розвиваються, і ще багато чого належить вивчити й оцінити. коментар Честера Вишневського, головного наукового співробітника Sophos.

Для якнайшвидшого подальшого розвитку штучного інтелекту та його ще ефективнішого використання в безпеці особливо важливий комплексний обмін між дослідниками та експертами зі штучного інтелекту. З цієї причини Sophos AI прагне відкрито ділитися результатами своїх досліджень із спільнотою безпеки, щоб зробити використання ШІ більш прозорим і активно сприяти обговоренню та позиціонуванню ШІ в кібербезпеці. Однією з найважливіших тем у подальшому розвитку ШІ в кібербезпеці є різні моделі та методи того, як ШІ навчається на старих і нових даних.

«Катастрофічне забування» як модель виявлення ШІ

Виявлення зловмисного програмного забезпечення є наріжним каменем ІТ-безпеки, а штучний інтелект є єдиним підходом, який може вивчати шаблони з мільйонів нових зразків шкідливого програмного забезпечення за лічені дні. Однак під час використання штучного інтелекту для виявлення зловмисного програмного забезпечення виникає два питання: чи повинна модель зберігати всі зразки зловмисного програмного забезпечення назавжди, щоб увімкнути оптимальне виявлення — хоча й за рахунок швидкості навчання та оновлення? Або він має виконати вибіркове тонке налаштування, яке дозволить моделі краще встигати за швидкістю змін шкідливого програмного забезпечення, ризикуючи забути старіші шаблони? Останнє відоме як «катастрофічне забування». Сьогодні перенавчання моделі займає близько тижня. Щоб оновити хорошу токарну модель, потрібно близько години.

Команда Sophos AI хотіла з’ясувати, чи можливо розробити модель тонкого налаштування, яка б ішла в ногу зі стрімко розвиваючимся ландшафтом загроз, вивчаючи нові шаблони, пам’ятаючи старі зразки, з мінімальним впливом на продуктивність. Дослідник Гілларі Сандерс взялася за це завдання та оцінила низку варіантів оновлення, які вона детально описує в блозі Sophos AI.

Дилема визнання

Підтримувати виявлення зловмисного програмного забезпечення в актуальному стані – непросте завдання. Кожен ваш крок, щоб захиститися від нападу, ваші опоненти відповідають новими ідеями, щоб уникнути його. Вони розробляють оновлення, використовуючи інший код або методи. У результаті щодня з’являються сотні тисяч нових зразків шкідливого програмного забезпечення.

Ще більше ускладнює виявлення той факт, що новітнє та найефективніше шкідливе програмне забезпечення рідко буває повністю «новим». Часто це поєднання нового, старого, спільного, запозиченого або вкраденого коду, а також прийнятої та адаптованої поведінки. Крім того, старе зловмисне програмне забезпечення знову з’являється через роки та інтегрується в нові методи атак, щоб захопити захист зненацька. Отже, моделі виявлення повинні гарантувати, що вони також виявляють старіші зразки зловмисного програмного забезпечення, а не лише найновіші.

Оновлення моделей виявлення ШІ

Коли справа доходить до оновлення моделей виявлення штучного інтелекту новими зразками зловмисного програмного забезпечення, постачальники мають два варіанти.

Option1: Зберігання кожного окремого зразка та повторне навчання моделі за допомогою постійно зростаючих обсягів даних. Це призводить до кращої загальної продуктивності, але також до повільніших оновлень і меншої кількості випусків.

Варіант 2: Модель виявлення оновлюється лише новими зразками. Це називається тонким налаштуванням. На кожному кроці процесу тонкого налаштування модель оновлюється за допомогою нових доданих знань і впливу на всі доступні шаблони. У результаті модель може «забути» («катастрофічно забути») старі шаблони, які вона раніше вивчила. Перевага: навчання моделі з меншою кількістю даних означає, що її можна швидше оновлювати та розгортати, щоб краще йти в ногу зі зловмисним програмним забезпеченням, яке швидко змінюється.

Постійне навчання моделей розпізнавання AI

Незалежно від двох згаданих варіантів, постійне навчання моделей розпізнавання штучного інтелекту новими зразками має вирішальне значення. Тому що шаблони, які штучний інтелект вивчає зі зразків зловмисного програмного забезпечення, не тільки дозволяють виявити те, що було безпосередньо навчено. ШІ також розпізнає раніше невідомі зразки, які демонструють принаймні певну схожість з навчальними даними. Однак з часом нові зразки відрізняються настільки, що стара модель стає менш ефективною та вимагає оновлення.

На діаграмі показано, як продуктивність розпізнавання погіршується з часом, якщо моделі не оновлюються (Зображення: Sophos).

Ліва частина графіка (поруч із пунктирною лінією) показує модель на часовій шкалі зі старішими навченими зразками. Тут рівень розпізнавання постійно високий. З правого боку додаються нові зразки, для яких модель ще не навчена, що призводить до нижчого рівня розпізнавання.

Три варіанти оновлення виявлення шкідливих програм

Гілларі Сандерс оцінила три варіанти оновлення виявлення шкідливих програм:

1. Вивчайте з добіркою старих і нових зразків

Це називається «репетицією даних» і передбачає змішування невеликої вибірки старих зразків із новими даними навчання, яких раніше не було. Таким чином, модель «запам’ятовує» стару інформацію, необхідну для розпізнавання старих шаблонів, і в той же час навчається розпізнавати новіші.

2. Регулювання швидкості навчання

При такому підході коригується швидкість навчання моделі. Це досягається шляхом визначення того, наскільки модель може змінитися після перегляду конкретного зразка. Якщо швидкість навчання занадто висока (у цьому випадку модель може сильно змінюватися з кожним доданим зразком), вона запам’ятовує лише найновіші зразки. Якщо швидкість навчання надто повільна (модель може лише незначно змінюватися з кожним доданим зразком), навчання займе занадто багато часу. Складність полягає в пошуку ідеального компромісу між швидкістю навчання, збереженням старої інформації та додаванням нової інформації.

3. Еластична консолідація ваги (EWC)

На діаграмі всі три підходи працюють краще на старих зразках зловмисного програмного забезпечення (ліворуч від пунктирної лінії), ніж на новіших зразках – справа від пунктирної лінії (Зображення: Sophos).

Цей підхід був натхненний роботою Google DeepMind у 2017 році. Як пружна пружина, вона натягує нову модель назад на стару, якщо вона починає «забуватися». Гілларі Сандерс має більш детальний опис цього принципу Блог SophosAI опублікований.

Як показано на графіку, усі три підходи працюють краще на старих зразках зловмисного програмного забезпечення (ліворуч від пунктирної лінії), ніж на новіших зразках (справа на пунктирній лінії).

висновок

Навчання з відбором старих і нових зразків (репетиція даних) є найкращим компромісом

У виявленні шкідливих програм здатність пам’ятати минуле майже така ж важлива, як і здатність передбачати майбутнє. Однак це необхідно порівняти з вартістю та швидкістю оновлення моделі новою інформацією. Репетиція даних — це простий і ефективний спосіб підтримувати виявлення старого зловмисного програмного забезпечення, одночасно значно збільшуючи швидкість оновлення та випуску нових моделей.

Дізнайтесь більше на Sophos.com

Про Софос

Sophos довіряють понад 100 мільйонів користувачів у 150 країнах. Ми пропонуємо найкращий захист від складних ІТ-загроз і втрати даних. Наші комплексні рішення безпеки прості в розгортанні, використанні та керуванні. Вони пропонують найнижчу сукупну вартість володіння в галузі. Sophos пропонує відзначені нагородами рішення для шифрування, рішення безпеки для кінцевих точок, мереж, мобільних пристроїв, електронної пошти та Інтернету. Також є підтримка від SophosLabs, нашої глобальної мережі власних аналітичних центрів. Штаб-квартири Sophos знаходяться в Бостоні, США, та Оксфорді, Великобританія.

Статті по темі

Звіт: на 40 відсотків більше фішингу в усьому світі

Поточний звіт про спам і фішинг від Касперського за 2023 рік говорить сам за себе: користувачі в Німеччині прагнуть ➡ Читати далі

ІТ-безпека: NIS-2 робить її головним пріоритетом

Лише в чверті німецьких компаній керівництво бере на себе відповідальність за ІТ-безпеку. Особливо в невеликих компаніях ➡ Читати далі

Стелс-шкідливе програмне забезпечення спрямоване на європейські компанії

Хакери атакують багато компаній по всій Європі за допомогою прихованого шкідливого програмного забезпечення. Дослідники ESET повідомили про різке збільшення так званих атак AceCryptor через ➡ Читати далі

У 104 році кількість кібератак зросла на 2023 відсотки

Компанія з кібербезпеки поглянула на ландшафт загроз минулого року. Результати дають важливе розуміння ➡ Читати далі

Закон про штучний інтелект та його наслідки для захисту даних

Завдяки Закону про штучний інтелект, перший закон про штучний інтелект був затверджений і дає виробникам програм ШІ від шести місяців до ➡ Читати далі

MDR та XDR через Google Workspace

У кафе, терміналі аеропорту чи домашньому офісі – співробітники працюють у багатьох місцях. Однак цей розвиток також несе проблеми ➡ Читати далі

Мобільні шпигунські програми становлять загрозу для бізнесу

Все більше людей використовують мобільні пристрої як у повсякденному житті, так і в компаніях. Це також знижує ризик «мобільного ➡ Читати далі

Тест: програмне забезпечення безпеки для кінцевих точок і окремих ПК

Останні результати тестування лабораторії AV-TEST показують дуже хорошу продуктивність 16 визнаних рішень захисту для Windows ➡ Читати далі

Sophos, Історії

, KI, навчання, Malware, Sophos

Реальність ШІ в кібербезпеці

Поділіться публікацією

«Катастрофічне забування» як модель виявлення ШІ

Дилема визнання

Оновлення моделей виявлення ШІ

Постійне навчання моделей розпізнавання AI

Три варіанти оновлення виявлення шкідливих програм

1. Вивчайте з добіркою старих і нових зразків

2. Регулювання швидкості навчання

3. Еластична консолідація ваги (EWC)

висновок

Статті по темі

До якої групи користувачів ви належите? (Без відстеження!)

важливі посилання

Останні статті та новини

Потім його шукали

Соціальні мережі