Microsoft, Meta та Amazon уклали угоди з “Вікіпедією” для навчання штучного інтелекту

Microsoft, Meta та Amazon укладуть угоди

У четвер, Фонд Wikimedia Enterprise оголосив про укладення ліцензійних угод на платній основі з Microsoft, Meta, Amazon, Perplexity та Mistral AI. Це розширює можливість стягнення платежів з провідних технологічних компаній за використання контенту Вікіпедії для навчання штучного інтелекту, на основі якого працюють асистенти, такі як Microsoft Copilot та ChatGPT.

Попри те, що раніше ці підприємства без дозволу масово брали дані з Wikipedia, нові угоди означають, що більшість відомих розробників ШІ стали учасниками програми Wikimedia Enterprise — комерційної підрозділу фонду, що пропонує доступ до API з 65 мільйонами статей Wikipedia з вищими швидкостями і більшими обсягами, ніж у безкоштовних публічних API. Фонд поки що не розкрив деталі угод.

До нових партнерів долучився Google, який підписав угоду з Wikimedia Enterprise у 2022 році, а також декілька менших компаній, таких як Ecosia, Nomic, Pleias, ProRata та Reef Media. Отримані кошти допоможуть покрити витрати на інфраструктуру неприбуткової організації, яка зазвичай покладається на дрібні публічні пожертви, спостерігаючи, як її контент стає основою для навчальних даних моделей ШІ.

Президент Wikimedia Enterprise Лейн Бекер у коментарі Reuters зазначив: “Wikipedia є критично важливим активом для роботи цих технологічних фірм, і їм потрібно знайти спосіб фінансової підтримки платформи. Нам знадобилося деякий час, щоб зрозуміти, які функції і можливості слід представити, щоб перевести ці компанії з безкоштовної платформи на комерційну, і всі наші партнери з Big Tech усвідомлюють необхідність підтримки Wikipedia.”

Перехід до платного ліцензування став результатом багаторічного зростання витрат на інфраструктуру, викликаних масовим збором контенту Wikipedia компаніями зі сфери ШІ. У квітні 2025 року фонд повідомив, що обсяг пропускної здатності, використаної для завантаження мультимедійних матеріалів, зріс на 50% у порівнянні з січнем 2024 року. У той же час боти відповідали за 65% найдорожчих запитів до базової інфраструктури, хоча їх частка у загальній кількості переглядів сторінок становила лише 35%.

Читайте  У соціальних мережах активно обговорюють "смерть" Solana через падіння до $5: гучний судовий розгляд викликав паніку

У жовтні Фонд Вікімедіа розкрив, що після оновлення систем виявлення ботів, трафік людей на Wikipedia скоротився приблизно на 8% у річному обчисленні. Виявилось, що значна частина відвідувань, які раніше вважалися людськими, насправді містила автоматизовані збори даних, створені для обману системи виявлення. Зниження трафіку може загрожувати порушенням зворотного зв’язку, який підтримував Wikipedia протягом останніх 25 років: читачі заходять на сайт, частина з них стає редакторами або донорами, і таким чином контент постійно покращується.

Сьогодні багато чат-ботів та пошукових систем відповідають на запитання, використовуючи контент Wikipedia, не перенаправляючи користувачів безпосередньо на сайт. Засновник Wikipedia Джиммі Вейлз у коментарі Associated Press висловив радість з приводу того, що моделі ШІ тренуються на даних Wikipedia.

 

“Особисто я дуже радий, що моделі ШІ отримують навчання на основі даних Wikipedia, оскільки вони контрольовані людьми. Я б не хотів працювати з ШІ, який навчався лише на певних джерелах — це могло б призвести до виникнення небажаного ШІ. Але є межа безкоштовного доступу. Компаніям варто скинутися і сплатити свою справедливу частку витрат, які ми несемо,” — висловився Вейлз.

Між тим, власні експерименти фонду з генеративним ШІ зіштовхнулися з опором від волонтерів-редакторів, які підтримують діяльність сайту. У червні Wikipedia зупинила пілотну програму зі створення резюме статей за допомогою ШІ після того, як редактори назвали її “неприємною ідеєю” і застерегли, що вона може підірвати довіру до платформи.

Avatar photo

Сидоренко Юлія — журналістка сайту podii.net. Навчалася у Харківському національному університеті імені В. Н. Каразіна, де здобула освіту у сфері журналістики та медіакомунікацій. Працює в журналістиці з 2008 року.

Події Новини - podii.net
Додати коментар