AI+Web3 сотрудничество: разблокировка новых форматов данных и вычислительной мощности

AI+Web3: Башни и площади

Основные моменты

  1. Проекты Web3 с концепцией ИИ стали объектами привлечения инвестиций на первичном и вторичном рынках.

  2. Возможности Web3 в AI-отрасли проявляются в: использовании распределенной стимуляции для координации потенциального предложения в длинном хвосте, включая данные, хранилище и вычисления; одновременно создавая модели с открытым исходным кодом и децентрализованный рынок AI-агентов.

  3. Искусственный интеллект в индустрии Web3 в основном используется в цепочечном финансировании (криптоплатежи, торговля, анализ данных) и для вспомогательной разработки.

  4. Эффективность AI+Web3 проявляется в их взаимодополнении: Web3 обещает противостоять централизации AI, AI обещает помочь Web3 выйти за пределы.

! AI+Web3: Башни и площади

Введение

За последние два года развитие ИИ стало ускоряться. Волнения, вызванные генеративным искусственным интеллектом на базе Chatgpt, также произвели огромный резонанс в области Web3.

Под воздействием концепции ИИ финансирование крипторынка значительно возросло. Согласно статистике, в первой половине 2024 года 64 проекта Web3+AI завершили финансирование, среди которых операционная система на базе искусственного интеллекта Zyber365 достигла максимального объема финансирования в 100 миллионов долларов в раунде A.

Вторичный рынок стал более процветающим, данные агрегатора криптовалют Coingecko показывают, что всего за немного больше года общая рыночная стоимость сектора ИИ достигла 48,5 миллиарда долларов, а объем торгов за 24 часа близок к 8,6 миллиарда долларов. Прогресс в основных технологиях ИИ приносит очевидные выгоды: после выпуска модели OpenAI Sora для преобразования текста в видео средняя цена в секторе ИИ выросла на 151%. Эффект ИИ также распространился на один из сегментов криптовалют, привлекающих капитал - Meme: первая концепция MemeCoin с AI Agent GOAT быстро стала популярной и была оценена в 1,4 миллиарда долларов, что успешно вызвало бум AI Meme.

Исследования и темы, связанные с AI+Web3, также на пике популярности: от AI+Depin до AI Memecoin, затем текущих AI Agent и AI DAO, скорость смены новых нарративов заставляет FOMO-эмоции не успевать за происходящим.

Комбинация терминов AI+Web3, полная горячих денег, возможностей и мечтаний о будущем, неизбежно воспринимается как организованный брак, навязанный капиталом. Нам трудно отличить под этой роскошной оболочкой, является ли это полем для спекулянтов или преддверием взрыва рассвета?

Чтобы ответить на этот вопрос, ключевым является размышление: станет ли лучше с другой стороной? Можно ли извлечь выгоду из модели другой стороны? В этой статье мы пытаемся рассмотреть эту структуру, опираясь на плечи предшественников: как Web3 может играть роль на различных этапах технологического стека AI, и что AI может привнести в Web3?

Возможности Web3 в рамках AI-стека

Перед тем как развивать эту тему, нам нужно понять технологический стек больших моделей ИИ:

Большие модели похожи на человеческий мозг, на ранних этапах они подобны только что родившемуся младенцу, которому необходимо наблюдать и поглощать огромное количество внешней информации, чтобы понять мир. Это этап "сбора" данных. Поскольку компьютеры не обладают человеческими многосенсорными способностями, перед обучением необходимо "предобработать" неразмеченную информацию и преобразовать её в формат, понятный компьютеру.

После ввода данных ИИ строит модель с пониманием и предсказательными способностями через "обучение", подобно тому, как ребенок постепенно понимает и изучает окружающий мир. Параметры модели аналогичны языковым способностям ребенка, которые постоянно корректируются. Содержимое обучения делится на предметы или общение с людьми для получения обратной связи и корректировки, что приводит к этапу "тонкой настройки".

Когда дети начинают говорить, они могут понимать смысл и выражать свои чувства и мысли в новых диалогах, что похоже на "вывод" больших моделей ИИ, которые могут выполнять предсказательный анализ на основе новых языковых и текстовых вводов. Младенцы выражают чувства, описывают объекты и решают проблемы с помощью языковых навыков, что аналогично тому, как большие модели ИИ применяются на этапе вывода для различных специфических задач, таких как классификация изображений, распознавание речи и т. д.

AI Агент более близок к следующей форме больших моделей — он способен самостоятельно выполнять задачи и стремиться к сложным целям, обладая не только способностью к мышлению, но и способностью к памяти, планированию и использованию инструментов для взаимодействия с миром.

В ответ на болевые точки различных стеков AI, Web3 в настоящее время на начальном этапе сформировала многоуровневую, взаимосвязанную экосистему, охватывающую все этапы процесса AI-моделей.

! AI+Web3: Башни и площади

Базовый уровень: Airbnb для вычислительной мощности и данных

Хэшрейт

В настоящее время одной из самых больших затрат AI является вычислительная мощность и энергия, необходимые для обучения моделей и моделирования вывода.

Например, для завершения обучения LLAMA3 от Meta требуется 16000 NVIDIA H100GPU на 30 дней. Цена одной версии H100 80GB составляет 30-40 тысяч долларов, что требует инвестиций в вычислительное оборудование (GPU + сетевые чипы) в размере от 400 до 700 миллионов долларов, а ежемесячные затраты на обучение составляют 1,6 миллиарда киловатт-часов, что приводит к расходам на энергетику почти в 20 миллионов долларов.

Разгрузка вычислительных мощностей ИИ также является одной из первых областей пересечения Web3 и ИИ — DePin (децентрализованная сеть физических инфраструктур). Сайт данных DePin Ninja перечислил более 1400 проектов, среди которых代表项目 GPU-вычислительных мощностей включают io.net, Aethir, Akash, Render Network и другие.

Основная логика заключается в том, что платформа позволяет владельцам неиспользуемых GPU ресурсов вносить вычислительную мощность в децентрализованном формате без необходимости получения разрешений, повышая степень использования не полностью использованных GPU ресурсов через онлайн-рынок, подобный Uber или Airbnb; конечные пользователи получают более доступные и эффективные вычислительные ресурсы; в то же время механизм стейкинга обеспечивает соответствующие наказания для поставщиков ресурсов в случае нарушения контроля качества или прерывания сети.

Особенности включают:

  • Сбор неиспользуемых ресурсов GPU: поставщиками являются в основном независимые малые и средние дата-центры, операторы крипто-горнодобывающих фабрик и другие, обладающие избыточными вычислительными ресурсами, а также оборудование для майнинга с механизмом консенсуса PoS, такое как майнеры для FileCoin и ETH. Некоторые проекты стремятся запустить устройства с более низким порогом входа, такие как exolab, использующий MacBook, iPhone, iPad и другие локальные устройства для создания вычислительной сети для работы с большими моделями.

  • Долгосрочный рынок вычислительных мощностей для ИИ: a. Техническая сторона: децентрализованный рынок вычислительной мощности более подходит для этапов вывода. Обучение в большей степени зависит от обработки данных с помощью огромных кластеров GPU, в то время как для вывода требования к вычислительной производительности GPU относительно ниже, как, например, Aethir, который сосредоточен на рендеринге с низкой задержкой и приложениях AI для вывода. b. Сторона спроса: малые и средние потребители вычислительной мощности не будут отдельно обучать свои большие модели, а просто выберут оптимизацию и донастройку вокруг немногих ведущих больших моделей, эти сценарии естественным образом подходят для распределенных неиспользуемых вычислительных ресурсов.

  • Децентрализованное владение: значение технологии блокчейна заключается в том, что владельцы ресурсов всегда сохраняют контроль над ресурсами, могут гибко регулировать их в зависимости от потребностей и одновременно получать прибыль.

Данные

Данные являются основой ИИ. Без данных вычисления бесполезны, как водяные лилии. Связь между данными и моделями аналогична пословице "Мусор на входе, мусор на выходе"; объем данных и качество входных данных определяют качество выходных данных конечной модели. Для текущего обучения моделей ИИ данные определяют языковые способности модели, способность к пониманию, а также ее ценности и гуманистические проявления. В настоящее время проблемы с потребностью в данных для ИИ в основном сосредоточены на четырех аспектах:

  • Жажда данных: Обучение моделей ИИ зависит от огромного объема входных данных. Согласно открытым данным, количество параметров, на которых OpenAI обучил GPT-4, достигает триллионов.

  • Качество данных: С объединением ИИ и различных отраслей возникают новые требования к качеству данных, такие как своевременность, разнообразие, профессионализм в узкоспециализированных данных и новые источники данных, такие как анализ эмоций в социальных сетях.

  • Проблемы конфиденциальности и соблюдения норм: различные страны и компании постепенно осознают важность качественных наборов данных и вводят ограничения на сбор данных.

  • Высокая стоимость обработки данных: большой объем данных, сложный процесс обработки. Открытые данные показывают, что более 30% затрат на НИОКР в AI-компаниях идет на сбор и обработку базовых данных.

В настоящее время решения web3 проявляются в следующих четырех аспектах:

  1. Сбор данных: Бесплатно предоставляемые данные из реального мира быстро истощаются, и расходы AI-компаний на данные растут из года в год. Но эти расходы не возвращаются настоящим источникам данных, платформы полностью наслаждаются созданием ценности, которую приносят данные, например, Reddit заработал в общей сложности 203 миллиона долларов, подписав соглашения о лицензировании данных с AI-компаниями.

Позволить пользователям, которые действительно вносят вклад, также участвовать в создании ценности, приносимой данными, а также получать более личные и ценные данные от пользователей с низкими затратами через распределенные сети и механизмы стимулов — это видение Web3.

  • Grass является децентрализованным уровнем данных и сетью, пользователи могут запустить узлы Grass, чтобы внести свой вклад в неиспользуемую пропускную способность и реляционные потоки для захвата реальных данных из всего Интернета и получения вознаграждений в токенах.

  • Vana вводит уникальную концепцию пула ликвидности данных (DLP), позволяя пользователям загружать личные данные (такие как записи о покупках, привычки просмотра, деятельность в социальных сетях и т.д.) в определенный DLP и гибко выбирать, разрешать ли использование этих данных определенными третьими сторонами.

  • В PublicAI пользователи могут использовать #AI或#Web3 в качестве категориальной метки на X и @PublicAI для сбора данных.

  1. Предобработка данных: В процессе обработки данных AI, поскольку собранные данные обычно шумные и содержат ошибки, их необходимо очистить и преобразовать в пригодный формат перед обучением модели, что включает в себя стандартизацию, фильтрацию и обработку пропущенных значений - повторяющуюся задачу. Этот этап является одним из немногих ручных процессов в индустрии AI, что привело к появлению профессии специалистов по разметке данных. С повышением требований моделей к качеству данных, порог вхождения для специалистов по разметке данных также увеличивается, и эта задача естественно подходит для децентрализованной системы вознаграждений Web3.
  • Grass и OpenLayer оба рассматривают возможность добавления этапа аннотирования данных, который является ключевым.

  • Synesis предложил концепцию "Train2earn", подчеркивая качество данных, пользователи могут получать вознаграждения за предоставление размеченных данных, комментариев или других форм ввода.

  • Проект по аннотации данных Sapien превращает задачи маркировки в игру и позволяет пользователям ставить свои баллы, чтобы зарабатывать больше баллов.

  1. Конфиденциальность и безопасность данных: необходимо прояснить, что конфиденциальность и безопасность данных — это два разных понятия. Конфиденциальность данных касается обработки чувствительных данных, в то время как безопасность данных защищает информацию от несанкционированного доступа, разрушения и кражи. Таким образом, преимущества технологий конфиденциальности Web3 и потенциальные сценарии применения проявляются в двух аспектах: (1) обучение на чувствительных данных; (2) сотрудничество данных: несколько владельцев данных могут совместно участвовать в обучении ИИ, не делясь исходными данными.

Текущие широко распространенные технологии конфиденциальности в Web3 включают:

  • Доверенная исполняемая среда ( TEE ), например, Super Protocol.

  • Полностью гомоморфное шифрование (FHE), например BasedAI, Fhenix.io или Inco Network.

  • Технология нулевых знаний (zk), такая как Reclaim Protocol, использует технологию zkTLS для генерации доказательства нулевых знаний для HTTPS-трафика, позволяя пользователям безопасно импортировать данные о мероприятиях, репутации и идентичности с внешних сайтов, не раскрывая конфиденциальную информацию.

Однако в настоящее время эта область все еще находится на ранней стадии, большинство проектов все еще находятся в процессе исследования, текущая проблема заключается в высоких вычислительных затратах, например:

  • Фреймворку zkML EZKL требуется примерно 80 минут для генерации доказательства модели 1M-nanoGPT.

  • Согласно данным Modulus Labs, затраты на zkML превышают затраты на чистые вычисления более чем в 1000 раз.

  1. Хранение данных: После получения данных необходимо место для хранения данных в цепочке, а также LLM, созданной с использованием этих данных. Вопрос доступности данных (DA) является ключевым, и до обновления Danksharding в Ethereum его пропускная способность составляла 0,08 МБ. В то же время, обучение AI-моделей и реализация в реальном времени обычно требуют пропускной способности данных от 50 до 100 ГБ в секунду. Эта разница в порядке величин делает существующие решения на цепочке неэффективными в условиях "ресурсоемких AI-приложений".
  • 0g.AI является представительным проектом в этой категории. Это централизованное решение для хранения, разработанное для высокопроизводительных требований AI, ключевые характеристики включают: высокую производительность и масштабируемость, поддержку быстрого загрузки и скачивания крупных наборов данных с помощью технологий продвинутой шардирования и кодирования с исправлением ошибок, скорость передачи данных близка к 5 ГБ в секунду.

Посредник: обучение и вывод модели

Децентрализованный рынок открытых моделей

Дебаты о том, должны ли AI модели быть закрытыми или открытыми, никогда не исчезали. Коллективные инновации, которые приносит открытый исходный код, являются неоспоримым преимуществом по сравнению с закрытыми моделями, однако как открытые модели могут повысить мотивацию разработчиков без прибыли? Это направление заслуживает размышлений. Основатель Baidu Ли Яньхун заявил в апреле этого года, что "открытые модели будут все больше отставать."

В связи с этим Web3 предлагает возможность создания децентрализованного открытого рынка моделей, то есть токенизации самих моделей, удерживая определенный процент токенов для команды и направляя часть будущих доходов от этой модели держателям токенов.

  • Протокол Bittensor создает P2P рынок открытых моделей, состоящий из десятков "подсетей", в которых поставщики ресурсов (вычисления, сбор/хранение данных, специалисты по машинному обучению) конкурируют друг с другом для достижения целей конкретного владельца подсети. Подсети могут взаимодействовать и обучаться друг у друга, что приводит к более мощному интеллекту. Награды распределяются на основе голосования сообщества и далее распределяются в зависимости от результатов соревнований.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 7
  • Поделиться
комментарий
0/400
LiquidityNinjavip
· 2ч назад
разыгрывайте людей как лохов я просто заколоченный дом
Посмотреть ОригиналОтветить0
metaverse_hermitvip
· 21ч назад
Заработать, да не стыдно.
Посмотреть ОригиналОтветить0
OnchainHolmesvip
· 21ч назад
А эта волна спекуляций снова пришла.
Посмотреть ОригиналОтветить0
RektRecordervip
· 21ч назад
Капитал снова учуял запах неудачников.
Посмотреть ОригиналОтветить0
SilentObservervip
· 21ч назад
Этот AI действительно жесткий
Посмотреть ОригиналОтветить0
GasFeeCrybabyvip
· 21ч назад
Когда же будет падение?
Посмотреть ОригиналОтветить0
SchroedingerMinervip
· 21ч назад
Блокчейн碎碎念 Открытие радостного Майнера
Посмотреть ОригиналОтветить0
  • Закрепить