AI Eğitim Paradigmasının Evrimi: Merkezî Kontrolden Merkeziyetsizlik İş Birliğine Teknik Devrim
AI'nın tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engel olan aşamadır. Bu, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasındaki hafif çağrılara kıyasla, eğitim süreci sürekli olarak büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritmaları desteği gerektirir, bu da AI sisteminin inşasının gerçek "ağır sanayi"sidir. Mimari paradigması açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu yazının odaklandığı Merkeziyetsizlik eğitimi.
Merkeziyetsizlik eğitimi, tek bir kurumun yerel yüksek performanslı kümeler içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkararak, GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur; yüksek verimlilik ve kontrol edilebilir kaynaklar avantajına sahiptir, ancak aynı zamanda veri tekeli, kaynak bariyerleri, enerji tüketimi ve tek nokta riski gibi sorunları da beraberinde getirmektedir.
Dağıtık eğitim, günümüzde büyük model eğitiminde ana akım yöntemdir, temel olarak model eğitim görevlerini parçalara ayırarak birden fazla makineye dağıtıp birlikte çalıştırmayı içerir, bu sayede tek bir makinenin hesaplama ve depolama darboğazlarını aşmayı amaçlar. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol, yönetim ve senkronizasyon altında tutulur, genellikle yüksek hızlı yerel alan ağları ortamında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi aracılığıyla ana düğüm her bir alt görevi koordine eder. Ana akım yöntemler arasında:
Veri paralelliği: Her düğüm farklı veri parametrelerini eğitir, model ağırlıkları eşleşmelidir.
Model paralelliği: Modelin farklı kısımlarını farklı düğümlere dağıtarak güçlü genişletilebilirlik sağlamak
Boru hattı paralel: Aşamalı seri yürütme, akış hızını artırır
Tensör paralelliği: Matris hesaplamalarını ince bir şekilde bölme, paralellik granülünü artırma
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını iş birliği yaparak bir görevi tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir gelecek yolu anlamına gelir. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinatör olmaksızın eğitim görevlerini işbirliği içinde tamamlar; genellikle görev dağıtımı ve işbirliği için protokollerle yönlendirilir ve katkıların dürüstlüğünü sağlamak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı ana zorluklar şunlardır:
Cihazların heterojenliği ve parçalanma zorluğu: Heterojen cihazların koordinasyonu zor, görev parçalama verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyon darboğazı belirgin
Ortak koordinasyon eksikliği: Merkezi bir denetleyici yok, görev dağıtımı ve hata geri alma mekanizmaları karmaşık.
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, her birinin hesaplama gücü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğudur. Bu zorluk, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok alana dahildir. Ancak, "etkili işbirliği + dürüstlüğü teşvik etme + doğru sonuçlar" sağlanıp sağlanamayacağı henüz erken prototip keşif aşamasındadır.
Federated learning, bir geçiş biçimi olarak dağıtık ve Merkeziyetsizlik arasında, verilerin yerel olarak korunmasına ve model parametrelerinin merkezi olarak toplanmasına vurgu yapar ve gizlilik uyumuna önem verilen senaryolar için uygundur. Federated learning, dağıtık eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitimindeki veri dağıtımının avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dirençli özelliklere sahip değildir. Gizlilik uyumu senaryolarında "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir, eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır ve endüstri için geçiş dağıtım yapısı olarak daha uygundur.
AI eğitim paradigması genel karşılaştırma tablosu
Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak taleplerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak farklı ve güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması uygun değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, bu nedenle açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları olan görevler, yasal uyumluluk ve etik kısıtlamalar nedeniyle açıkça paylaşılamaz; işbirliği teşvik temeli eksik olan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturur.
Ancak bu, merkeziyetsizlik eğitiminin bir safsata olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolayca paralel hale getirilebilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalaması sonrası eğitim görevleri, veri toplama eğitim ve etiketleme görevleri, kaynak kontrolü altında küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir ve P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yöntemler aracılığıyla işbirlikçi eğitim için son derece uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda merkeziyetsizlik eğitim ve federasyon öğrenimi öncü alanında, temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai, sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermekte, mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise görece daha net olup, ilk mühendislik ilerlemeleri görülebilmektedir. Bu makale, bu beş projenin arkasındaki temel teknolojileri ve mühendislik mimarilerini sırayla analiz edecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkilerini daha fazla tartışacaktır.
Prime Intellect: Eğitim yolu doğrulanabilir pekiştirme öğrenimi iş birliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı kurmayı hedefliyor, böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modül aracılığıyla, doğrulanabilir, açık ve teşvik mekanizmasıyla tam bir AI merkeziyetsiz eğitim sistemi inşa etmeyi umuyor.
Bir, Prime Intellect Protokol Yığını Yapısı ve Ana Modül Değeri
İkincisi, Prime Intellect eğitiminin ana mekanizmalarının ayrıntılı açıklaması
PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile asenkron katılıma yönelik olarak geliştirilmiştir. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak benimser, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız olarak görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve birleştirme mekanizmaları ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir planlamanın olmadığı ortamda esnek eğitim uygulamak için daha uygundur, hem sistem karmaşıklığını azaltır hem de çoklu görevlerin paralel olarak yürütülmesi ve strateji evrimi için bir temel oluşturur.
TOPLOC:Ağırlıksız eğitim davranış doğrulama mekanizması
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenimi tamamlayıp tamamlamadığını belirlemek için kullanılan bir eğitim doğrulama çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tüm model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi ↔ strateji güncellemesi" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştürerek, güven olmadan eğitim ödül dağıtımı sağlamanın anahtar yeniliğidir ve denetlenebilir, teşvik edici merkeziyetsiz işbirliği eğitim ağı inşa etmek için uygulanabilir bir yol sunar.
SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve birleştirme protokolüdür ve gerçek ağ ortamları için asenkron, bant genişliği kısıtlı ve düğüm durumu değişkenliği için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirir, birden fazla düğümün senkronize olmayan bir durumda sürekli olarak kısmi güncellemeler göndermesine olanak tanır ve ağırlıkların kademeli olarak yakınsamasını ve çoklu sürüm evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsizlik eğitiminde ölçeklenebilirlik ve hata toleransı yeteneklerini önemli ölçüde artırır ve stabil ağırlık konsensüsü ile sürekli eğitim iterasyonunun temel temelini oluşturur.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo felsefesini bağımsız olarak gerçekleştirdiği ve açık kaynak yaptığı bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtları, heterojen cihazlar ve düzensiz düğümler gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmaktadır ve Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınır; yalnızca yerel komşu düğümlere dayanarak model işbirlikçi eğitimini tamamlayabilir. Asenkron güncellemeler ve kesinti toleransı mekanizmaları ile OpenDiLoCo, tüketici sınıfı GPU'lar ile kenar cihazlarının eğitim görevlerine kararlı bir şekilde katılmasını sağlar ve küresel işbirlikçi eğitimin katılımını önemli ölçüde artırır. Merkeziyetsizlik eğitim ağı inşa etmenin temel iletişim altyapılarından biridir.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden geri yüklemeyi destekler, tüketici sınıfı GPU'lar ve istikrarsız düğümler üzerinde çalışabilir, OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güvene ihtiyaç duymayan işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını oluşturur.
Üç, Prime Intellect Teşvik Ağı ve Rol Dağılımı
Prime Intellect, herkesin görevlere katılmasını ve gerçek katkılara dayalı ödüller kazanmasını sağlayan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmalarına sahip bir eğitim ağı inşa etti. Protokol, üç temel rol üzerine çalışmaktadır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar.
Eğitim düğümü: Yerel eğitim gerçekleştir, ağırlık güncellemelerini ve gözlem izlerini gönder
Doğrulama Düğümleri: TOPLOC mekanizması ile eğitim davranışının doğruluğunu doğrulamak ve ödül hesaplamalarına ve strateji toplama katılmak
Protokolün ana süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ve ödül dağıtımını içerir ve "gerçek eğitim davranışları" etrafında bir teşvik kapalı döngü oluşturur.
Dört, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin lansmanı
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü; bu, dünya genelinde asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri tarafından işbirliğiyle eğitilen ilk güçlendirilmiş öğrenme büyük modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada bulunan 100'den fazla GPU heterojen düğüm tarafından işbirliğiyle eğitildi ve tamamen asenkron bir mimari kullanıldı, eğitim süresi 400 saatten fazla sürdü ve asenkron işbirliği ağının uygulanabilirliğini ve istikrarını gösterdi. Bu model sadece bir performans atılımı değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmasının ilk sistematik uygulamasıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, Merkeziyetsizlik eğitim ağının eğitim sürecini açık hale getirme, doğrulayıcı ve ekonomik teşvik kapalı döngüsünü gerçekleştirdiğini işaret etmektedir.
Performans açısından, INTELLECT-2 QwQ-32B üzerinde eğitim aldı ve kod ve matematik açısından özel RL eğitimi yaptı, mevcut açık kaynaklı RL ince ayar modellerinin ön saflarında yer alıyor.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
12 Likes
Reward
12
7
Share
Comment
0/400
SolidityStruggler
· 2h ago
Zincir MDA motoru
View OriginalReply0
NotSatoshi
· 07-20 22:41
Hesap açmak bir zorunluluktur.
View OriginalReply0
CryptoHistoryClass
· 07-20 22:40
*sigh* tıpkı '99'daki dotcom merkeziyetsizlik heyecanı gibi... hiç öğrenmiyoruz değil mi
View OriginalReply0
BridgeTrustFund
· 07-20 22:37
Ekmek parası bile yetmiyor, bir de antrenman yapıyor.
View OriginalReply0
MonkeySeeMonkeyDo
· 07-20 22:37
Kral döngüleri hemen buraya gelsin!
View OriginalReply0
AirdropHuntress
· 07-20 22:37
Bu bölünmenin açıkça bir fon dağıtım risk yönetimi sorunu olduğunu düşünüyorum.
Merkeziyetsizlik AI eğitim devrimi: Prime Intellect açık işbirliği yeni paradigmasını yönlendiriyor
AI Eğitim Paradigmasının Evrimi: Merkezî Kontrolden Merkeziyetsizlik İş Birliğine Teknik Devrim
AI'nın tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engel olan aşamadır. Bu, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasındaki hafif çağrılara kıyasla, eğitim süreci sürekli olarak büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritmaları desteği gerektirir, bu da AI sisteminin inşasının gerçek "ağır sanayi"sidir. Mimari paradigması açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu yazının odaklandığı Merkeziyetsizlik eğitimi.
Merkeziyetsizlik eğitimi, tek bir kurumun yerel yüksek performanslı kümeler içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkararak, GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur; yüksek verimlilik ve kontrol edilebilir kaynaklar avantajına sahiptir, ancak aynı zamanda veri tekeli, kaynak bariyerleri, enerji tüketimi ve tek nokta riski gibi sorunları da beraberinde getirmektedir.
Dağıtık eğitim, günümüzde büyük model eğitiminde ana akım yöntemdir, temel olarak model eğitim görevlerini parçalara ayırarak birden fazla makineye dağıtıp birlikte çalıştırmayı içerir, bu sayede tek bir makinenin hesaplama ve depolama darboğazlarını aşmayı amaçlar. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol, yönetim ve senkronizasyon altında tutulur, genellikle yüksek hızlı yerel alan ağları ortamında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi aracılığıyla ana düğüm her bir alt görevi koordine eder. Ana akım yöntemler arasında:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını iş birliği yaparak bir görevi tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir gelecek yolu anlamına gelir. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinatör olmaksızın eğitim görevlerini işbirliği içinde tamamlar; genellikle görev dağıtımı ve işbirliği için protokollerle yönlendirilir ve katkıların dürüstlüğünü sağlamak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı ana zorluklar şunlardır:
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, her birinin hesaplama gücü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğudur. Bu zorluk, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok alana dahildir. Ancak, "etkili işbirliği + dürüstlüğü teşvik etme + doğru sonuçlar" sağlanıp sağlanamayacağı henüz erken prototip keşif aşamasındadır.
Federated learning, bir geçiş biçimi olarak dağıtık ve Merkeziyetsizlik arasında, verilerin yerel olarak korunmasına ve model parametrelerinin merkezi olarak toplanmasına vurgu yapar ve gizlilik uyumuna önem verilen senaryolar için uygundur. Federated learning, dağıtık eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitimindeki veri dağıtımının avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dirençli özelliklere sahip değildir. Gizlilik uyumu senaryolarında "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir, eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır ve endüstri için geçiş dağıtım yapısı olarak daha uygundur.
AI eğitim paradigması genel karşılaştırma tablosu
Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak taleplerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak farklı ve güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması uygun değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, bu nedenle açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları olan görevler, yasal uyumluluk ve etik kısıtlamalar nedeniyle açıkça paylaşılamaz; işbirliği teşvik temeli eksik olan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturur.
Ancak bu, merkeziyetsizlik eğitiminin bir safsata olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolayca paralel hale getirilebilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalaması sonrası eğitim görevleri, veri toplama eğitim ve etiketleme görevleri, kaynak kontrolü altında küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir ve P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yöntemler aracılığıyla işbirlikçi eğitim için son derece uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda merkeziyetsizlik eğitim ve federasyon öğrenimi öncü alanında, temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai, sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermekte, mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise görece daha net olup, ilk mühendislik ilerlemeleri görülebilmektedir. Bu makale, bu beş projenin arkasındaki temel teknolojileri ve mühendislik mimarilerini sırayla analiz edecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkilerini daha fazla tartışacaktır.
Prime Intellect: Eğitim yolu doğrulanabilir pekiştirme öğrenimi iş birliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı kurmayı hedefliyor, böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modül aracılığıyla, doğrulanabilir, açık ve teşvik mekanizmasıyla tam bir AI merkeziyetsiz eğitim sistemi inşa etmeyi umuyor.
Bir, Prime Intellect Protokol Yığını Yapısı ve Ana Modül Değeri
İkincisi, Prime Intellect eğitiminin ana mekanizmalarının ayrıntılı açıklaması
PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile asenkron katılıma yönelik olarak geliştirilmiştir. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak benimser, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız olarak görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve birleştirme mekanizmaları ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir planlamanın olmadığı ortamda esnek eğitim uygulamak için daha uygundur, hem sistem karmaşıklığını azaltır hem de çoklu görevlerin paralel olarak yürütülmesi ve strateji evrimi için bir temel oluşturur.
TOPLOC:Ağırlıksız eğitim davranış doğrulama mekanizması
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenimi tamamlayıp tamamlamadığını belirlemek için kullanılan bir eğitim doğrulama çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tüm model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi ↔ strateji güncellemesi" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştürerek, güven olmadan eğitim ödül dağıtımı sağlamanın anahtar yeniliğidir ve denetlenebilir, teşvik edici merkeziyetsiz işbirliği eğitim ağı inşa etmek için uygulanabilir bir yol sunar.
SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve birleştirme protokolüdür ve gerçek ağ ortamları için asenkron, bant genişliği kısıtlı ve düğüm durumu değişkenliği için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirir, birden fazla düğümün senkronize olmayan bir durumda sürekli olarak kısmi güncellemeler göndermesine olanak tanır ve ağırlıkların kademeli olarak yakınsamasını ve çoklu sürüm evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsizlik eğitiminde ölçeklenebilirlik ve hata toleransı yeteneklerini önemli ölçüde artırır ve stabil ağırlık konsensüsü ile sürekli eğitim iterasyonunun temel temelini oluşturur.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo felsefesini bağımsız olarak gerçekleştirdiği ve açık kaynak yaptığı bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtları, heterojen cihazlar ve düzensiz düğümler gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmaktadır ve Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınır; yalnızca yerel komşu düğümlere dayanarak model işbirlikçi eğitimini tamamlayabilir. Asenkron güncellemeler ve kesinti toleransı mekanizmaları ile OpenDiLoCo, tüketici sınıfı GPU'lar ile kenar cihazlarının eğitim görevlerine kararlı bir şekilde katılmasını sağlar ve küresel işbirlikçi eğitimin katılımını önemli ölçüde artırır. Merkeziyetsizlik eğitim ağı inşa etmenin temel iletişim altyapılarından biridir.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden geri yüklemeyi destekler, tüketici sınıfı GPU'lar ve istikrarsız düğümler üzerinde çalışabilir, OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güvene ihtiyaç duymayan işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını oluşturur.
Üç, Prime Intellect Teşvik Ağı ve Rol Dağılımı
Prime Intellect, herkesin görevlere katılmasını ve gerçek katkılara dayalı ödüller kazanmasını sağlayan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmalarına sahip bir eğitim ağı inşa etti. Protokol, üç temel rol üzerine çalışmaktadır:
Protokolün ana süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ve ödül dağıtımını içerir ve "gerçek eğitim davranışları" etrafında bir teşvik kapalı döngü oluşturur.
Dört, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin lansmanı
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü; bu, dünya genelinde asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri tarafından işbirliğiyle eğitilen ilk güçlendirilmiş öğrenme büyük modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada bulunan 100'den fazla GPU heterojen düğüm tarafından işbirliğiyle eğitildi ve tamamen asenkron bir mimari kullanıldı, eğitim süresi 400 saatten fazla sürdü ve asenkron işbirliği ağının uygulanabilirliğini ve istikrarını gösterdi. Bu model sadece bir performans atılımı değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmasının ilk sistematik uygulamasıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, Merkeziyetsizlik eğitim ağının eğitim sürecini açık hale getirme, doğrulayıcı ve ekonomik teşvik kapalı döngüsünü gerçekleştirdiğini işaret etmektedir.
Performans açısından, INTELLECT-2 QwQ-32B üzerinde eğitim aldı ve kod ve matematik açısından özel RL eğitimi yaptı, mevcut açık kaynaklı RL ince ayar modellerinin ön saflarında yer alıyor.