Злиття AI і Web3: відкриті ринки та спільне створення цінностей

AI+Web3: Вежі та площі

ТЛ; ДОКТОР

  1. Проекти Web3 з концепцією штучного інтелекту стають привабливими об'єктами для залучення інвестицій на первинних та вторинних ринках.

  2. Можливості Web3 в галузі штучного інтелекту проявляються в: використанні розподілених стимулів для координації потенційних постачальників у довгому хвості ------ між даними, зберіганням та обчисленнями; одночасно створенням відкритої моделі та децентралізованого ринку AI-агентів.

  3. Основні сфери використання AI в індустрії Web3 - це фінанси на блокчейні (криптооплата, торгівля, аналіз даних) та допомога в розробці.

  4. Корисність AI+Web3 полягає в їхній взаємодоповнювальності: Web3 має надію протистояти централізації AI, а AI має надію допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

За останні два роки розвиток штучного інтелекту наче прискорився, ця метелика крила, спровокована Chatgpt, не лише відкрила новий світ генеративного штучного інтелекту, але й викликала потужні течії в Web3.

За підтримки концепції штучного інтелекту, помітно відновилися інвестиції в крипторинок, який сповільнився. Згідно зі статистикою ЗМІ, лише в першій половині 2024 року 64 проекти Web3+AI завершили фінансування, а операційна система на базі штучного інтелекту Zyber365 залучила 100 мільйонів доларів в рамках раунду A.

Ринок вторинних активів став ще більш процвітаючим. За даними одного з криптоагрегаторів, всього за трохи більше ніж рік загальна капіталізація AI-сектора досягла 48,5 мільярда доларів, а обсяг торгів за 24 години наблизився до 8,6 мільярда доларів; очевидні позитивні наслідки прогресу основних AI-технологій: після випуску моделі OpenAI Sora для перетворення тексту в відео середня ціна в AI-секторі зросла на 151%; ефект AI також поширився на один із секторів криптовалют, що залучають інвестиції, Meme: перша концепція AI Agent, MemeCoin ------ GOAT, швидко стала популярною та отримала оцінку в 1,4 мільярда доларів, успішно запустивши хвилю AI Meme.

Дослідження та теми, пов'язані з AI+Web3, також набирають популярності: від AI+Depin до AI Memecoin, а потім до поточних AI Agent і AI DAO, емоція FOMO вже не встигає за швидкістю зміни нових наративів.

AI+Web3, ця комбінація термінів, наповнена гарячими грошима, тенденціями та майбутніми фантазіями, неминуче сприймається як шлюб, організований капіталом, нам здається, що ми важко можемо розрізнити, під цією розкішною мантією, насправді це арена спекулянтів, чи це переддень вибуху світанку?

Щоб відповісти на це питання, важливим міркуванням для обох сторін є те, чи стане краще з присутністю один одного? Чи можливо отримати вигоду з моделі іншого? У цій статті ми також намагаємося подивитися на цю схему з позицій попередників: як Web3 може відігравати роль на всіх етапах технологічного стеку AI, і що нового AI може принести Web3?

! AI+Web3: Вежі та Квадрати

Частина 1 Які можливості має Web3 під стеком AI?

Перш ніж розпочати цю тему, нам потрібно зрозуміти технічний стек великих моделей ШІ:

Використовуючи більш зрозумілу мову, щоб пояснити весь процес: «велика модель» подібна до людського мозку. На початкових етапах цей мозок належить новонародженій дитині, яка повинна спостерігати та споживати величезну кількість інформації з навколишнього світу, щоб зрозуміти цей світ, це є етапом «збирання» даних; оскільки комп'ютери не мають людських зорових, слухових та інших сенсорних функцій, перед навчанням великі обсяги неідентифікованої інформації з навколишнього середовища необхідно перетворити через «попередню обробку» в формат інформації, зрозумілий та придатний для використання комп'ютерами.

Після введення даних AI через «навчання» створює модель, яка має здатність до розуміння та прогнозування, що можна розглядати як процес, в якому немовля поступово розуміє та вивчає навколишній світ. Параметри моделі подібні до мовних навичок немовляти, які постійно коригуються в процесі навчання. Коли зміст навчання починає розподілятися за предметами, або під час спілкування з людьми отримується зворотний зв'язок та вносяться корективи, переходять до етапу «тонкої настройки» великої моделі.

Діти, коли вони поступово ростуть і навчаються говорити, можуть розуміти значення в нових розмовах і виражати свої почуття та думки. Ця стадія подібна до «висновків» у великих моделях ШІ, де модель може передбачати та аналізувати нові мовні та текстові введення. Немовлята виражають почуття, описують об'єкти та вирішують різні проблеми за допомогою мовних навичок, що також подібно до того, як великі моделі ШІ застосовуються на етапі висновків для виконання різноманітних специфічних завдань, таких як класифікація зображень, розпізнавання мови тощо.

А AI Agent наближається до наступної форми великої моделі------здатної самостійно виконувати завдання та прагнути складних цілей, не лише володіючи мисленням, але й здатною до пам'яті, планування, а також використовувати інструменти для взаємодії з світом.

Наразі, з огляду на болі в різних стекових рішеннях, Web3 наразі початково сформував багатошарову, взаємопов'язану екосистему, що охоплює всі етапи процесу моделей AI.

Один. Базовий рівень: обчислювальна потужність та дані Airbnb

Потужність

На даний момент однією з найвищих витрат AI є обчислювальна потужність та енергія, необхідні для навчання моделей та моделювання висновків.

Прикладом є те, що LLAMA3 від Meta потребує 16000 H100GPU, вироблених NVIDIA (це топовий графічний процесор, спеціально розроблений для штучного інтелекту та високопродуктивних обчислювальних навантажень), щоб завершити навчання за 30 днів. У версії з 80 ГБ одинична вартість коливається від 30,000 до 40,000 доларів, що потребує інвестицій у комп'ютерне обладнання (GPU + мережеві чіпи) на суму від 4 до 7 сотень мільйонів доларів, у той же час щомісячне навчання потребує 1.6 мільярда кіловат-годин, витрати на енергію щомісяця становлять майже 20 мільйонів доларів.

Розвантаження AI обчислювальної потужності є однією з перших областей перетворення Web3 та AI ------ DePin (мережа децентралізованої фізичної інфраструктури). На даний момент один з веб-сайтів даних вже представив понад 1400 проектів, серед яких проекти, що представляють спільне використання GPU обчислювальної потужності, включають io.net, Aethir, Akash, Render Network та інші.

Основна логіка полягає в тому, що платформа дозволяє особам або організаціям, які мають невикористані ресурси GPU, вносити свій обчислювальний потенціал у децентралізований спосіб без необхідності отримання дозволу. Це підвищує використання не повністю експлуатованих ресурсів GPU за допомогою онлайн-ринку покупців і продавців, подібного до Uber або Airbnb, що також дозволяє кінцевим користувачам отримувати більш доступні та ефективні обчислювальні ресурси. Одночасно механізм стейкінгу також забезпечує, що у разі порушення механізму контролю якості або переривання мережі постачальники ресурсів підлягають відповідним покаранням.

Її особливості полягають у:

  • Збір невикористаних ресурсів GPU: постачальниками є переважно незалежні оператори середніх і малих дата-центрів, крипто-майнінгові ферми та інші, які мають надлишкові обчислювальні ресурси, а механізм консенсусу - PoS, наприклад, для майнінгового обладнання FileCoin та ETH. Наразі також є проекти, які прагнуть запустити обладнання з нижчими бар'єрами входу, такі як exolab, що використовує MacBook, iPhone, iPad та інші локальні пристрої для створення обчислювальної мережі для інференції великих моделей.

  • Перед ринком довгого хвоста потужностей ШІ:

a. "З технологічної точки зору" децентралізований ринок обчислювальних потужностей більше підходить для етапів виведення. Навчання більше залежить від обробної потужності, що надається надвеликими кластерними GPU, тоді як виведення вимагає від GPU відносно нижчої обчислювальної продуктивності, як, наприклад, Aethir, який зосереджується на рендерингу з низькою затримкою та застосуваннях AI для виведення.

b. "З точки зору попиту" малі та середні замовники обчислювальних потужностей не будуть окремо навчати свої великі моделі, а просто виберуть оптимізацію та доопрацювання навколо кількох провідних великих моделей, і ці сценарії природним чином підходять для розподілених невикористаних обчислювальних ресурсів.

  • Децентралізована власність: технологічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, гнучко налаштовуючи їх відповідно до потреб і отримуючи прибуток.

Дані

Дані є основою ШІ. Якщо немає даних, обчислення, як водорості на поверхні, не мають жодної користі, а зв'язок між даними та моделями схожий на прислів'я "Сміття на вході, сміття на виході". Кількість даних та якість введення визначають кінцеву якість виходу моделі. Для навчання сучасних ШІ-моделей дані визначають мовні здібності моделі, розуміння, навіть цінності та гуманізацію. Наразі труднощі з потребами даних для ШІ зосереджені на чотирьох основних аспектах:

  • Голод даних: навчання моделей ШІ залежить від великого обсягу вхідних даних. З відкритих джерел відомо, що OpenAI навчала GPT-4 з параметрами на рівні трильйонів.

  • Якість даних: з інтеграцією ШІ в різні галузі виникають нові вимоги до якості даних, такі як своєчасність даних, різноманітність даних, спеціалізація вертикальних даних та вплив нових джерел даних, таких як емоції в соціальних мережах.

  • Проблеми конфіденційності та відповідності: В даний час різні країни та компанії поступово усвідомлюють важливість якісних наборів даних і вводять обмеження на збори даних.

  • Високі витрати на обробку даних: велика кількість даних, складний процес обробки. Відкриті дані свідчать, що понад 30% витрат на НДДКР в ІТ-компаніях витрачається на збір та обробку базових даних.

Наразі рішення web3 виявляються в чотирьох аспектах:

  1. Збір даних: можливість безкоштовно надавати зібрані дані з реального світу швидко вичерпується, витрати AI компаній на дані зростають щороку. Але водночас ці витрати не повертаються до справжніх постачальників даних, платформи повністю насолоджуються створенням вартості, яку приносять дані, наприклад, одна соціальна платформа отримала загальний дохід у 203 мільйони доларів, підписавши угоду про ліцензування даних з компанією AI.

Дати можливість справжнім учасникам вносити свій вклад у створення вартості даних, а також отримувати більш приватні та цінні дані від користувачів за допомогою дистрибуційної мережі та механізму стимулювання, є баченням Web3.

  • Grass є децентралізованим рівнем даних і мережею, користувачі можуть запустити вузли Grass, щоб внести свій внесок у невикористаний пропускний здатність і релейний трафік для захоплення реальних даних з усього Інтернету і отримання токенів у винагороду;

  • Vana впроваджує унікальну концепцію пулу ліквідності даних (DLP), де користувачі можуть завантажувати свої приватні дані (такі як історія покупок, звички перегляду, активність у соціальних мережах тощо) до певного DLP та гнучко обирати, чи надавати ці дані для використання певним третім особам;

  • У PublicAI користувачі можуть використовувати #AI 或#Web3 як категорію на X та @PublicAI для збору даних.

  1. Попередня обробка даних: під час обробки даних AI, оскільки зібрані дані зазвичай є шумними та містять помилки, їх необхідно очистити та перетворити в придатний формат до навчання моделі, що включає стандартизацію, фільтрацію та обробку пропущених значень. Ця стадія є однією з небагатьох ручних ланок в індустрії AI, внаслідок чого виникла професія аналітиків даних. З підвищенням вимог моделі до якості даних, поріг входження для аналітиків даних також підвищується, і це завдання природно підходить для децентралізованих механізмів винагороди Web3.
  • Наразі Grass та OpenLayer обидва розглядають можливість приєднання до цього ключового етапу маркування даних.

  • Synesis提出ив концепцію «Train2earn», підкреслюючи якість даних, користувачі можуть отримувати винагороди, надаючи марковані дані, коментарі або інші форми внеску.

  • Проект маркування даних Sapien перетворює завдання маркування на гру та дозволяє користувачам стейкати бали для отримання більшої кількості балів.

  1. Конфіденційність даних та безпека: необхідно чітко розуміти, що конфіденційність даних та безпека - це два різні поняття. Конфіденційність даних стосується обробки чутливих даних, тоді як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Таким чином, переваги технологій конфіденційності Web3 та потенційні сценарії їх застосування виявляються в двох аспектах: (1) навчання на чутливих даних; (2) співпраця з даними: кілька власників даних можуть спільно брати участь у навчанні AI, не ділячись своїми первинними даними.

Актуальні технології приватності в Web3 включають:

  • Достовірне виконуване середовище ( TEE ), наприклад, Super Protocol;

  • Повна гомоморфна криптографія (FHE), наприклад BasedAI, Fhenix.io або Inco Network;

  • Технології нульових знань (zk), такі як протокол Reclaim, використовують технологію zkTLS для генерації доказів нульових знань для HTTPS-трафіку, що дозволяє користувачам безпечно імпортувати дані про активність, репутацію та ідентичність з зовнішніх веб-сайтів без розкриття чутливої інформації.

Проте, наразі ця сфера все ще перебуває на ранній стадії, більшість проєктів все ще досліджуються, актуальною проблемою є занадто високі витрати на обчислення, деякі приклади такі:

  • zkML фреймворк
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • Поділіться
Прокоментувати
0/400
MEVHunterLuckyvip
· 1год тому
Ще одна хвиля прийшла, дійсно багато спекуляцій навколо концепції ШІ.
Переглянути оригіналвідповісти на0
ChainDetectivevip
· 12год тому
Прийшли заробляти гроші!!
Переглянути оригіналвідповісти на0
0xDreamChaservip
· 12год тому
Коли ШІ зустрічає Web3, то справді розважається.
Переглянути оригіналвідповісти на0
0xTherapistvip
· 12год тому
Приходь, зробимо.
Переглянути оригіналвідповісти на0
DuskSurfervip
· 12год тому
Знову ритм обману для дурнів
Переглянути оригіналвідповісти на0
  • Закріпити