إعادة تشكيل متصفح الإنترنت بواسطة الذكاء الاصطناعي من عرض المعلومات إلى استدعاء الوكلاء الذكيين

robot
إنشاء الملخص قيد التقدم

إعادة بناء المتصفح في عصر الذكاء الاصطناعي: من التفاعل بين الإنسان والآلة إلى استدعاء الوكيل

تطور المتصفحات

تاريخ المتصفحات كمدخل إلى الإنترنت شهد تطوراً طويلاً من Netscape إلى Chrome. كانت المنافسة في المتصفحات في المراحل المبكرة تركز على سرعة العرض وتجربة المستخدم، بينما تحول محور المنافسة اليوم إلى دمج قدرات الذكاء الاصطناعي.

في التسعينيات، أطلقت Netscape العنان لثورة التصفح الرسومي، ولكنها سرعان ما هُزمت بواسطة استراتيجية الربط النظامي من Microsoft مع IE. ظهر Firefox بفضل روحه المفتوحة وبيئة الإضافات، لكنه في النهاية تم تجاوزه بواسطة Chrome من Google بفضل التكرار السريع وتجربة متعددة المنصات.

دخلت عصر الهواتف المحمولة، حيث تسيطر منتجات خفيفة الوزن مثل متصفح UC على الأسواق الناشئة، ولكن مع انتشار الهواتف الذكية وتغير السياسات، بدأت قوتها تتراجع تدريجياً. اليوم، أصبح متصفح Chrome يحتل مكانة رائدة على سطح المكتب، حيث تصل حصته في السوق العالمية إلى حوالي 65%.

ومع ذلك، فإن صعود النماذج اللغوية الكبيرة يهز هذا المشهد. يميل المستخدمون بشكل متزايد إلى الحصول على المعلومات مباشرة من صفحة نتائج البحث، بينما تتناقص سلوكيات النقر على صفحات الويب التقليدية. في الوقت نفسه، فإن الشائعات حول احتمال استبدال Apple لمحرك البحث الافتراضي في Safari تهدد أساس أرباح Google بشكل أكبر.

ضرورة إعادة تشكيل المتصفح بواسطة الذكاء الاصطناعي

على الرغم من قوة قدرات الذكاء الاصطناعي، إلا أن المتصفح كمنصة عامة لا يزال لا غنى عنه. الأسباب كالتالي:

  1. المتصفح هو مكان تخزين البيانات الشخصية، بما في ذلك كلمات المرور، وملفات تعريف الارتباط، وغيرها من المعلومات الحساسة.

  2. يجب أن تتم سلوكيات المستخدم المعقدة والعمليات الآلية داخل صندوق الرمل في المتصفح.

  3. يوفر المتصفح حدود ثقة موحدة وواجهة استدعاء وظائف.

  4. يتم ترسيب كميات كبيرة من بيانات السياق في المتصفح، بما في ذلك علامات التبويب و IndexedDB وغيرها.

إن الشيء الذي يمكن أن يقلب هيكل المتصفح الحالي ليس "كروم" أفضل، بل هي بنية تفاعل جديدة: الانتقال من عرض المعلومات إلى استدعاء المهام. يجب أن تكون المتصفحات المستقبلية مصممة لوكلاء الذكاء الاصطناعي، بحيث يمكنها قراءة المعلومات وأيضًا تنفيذ عمليات معقدة.

استكشاف متصفح AI من الجيل الجديد

استخدام المتصفح

بنى Browser Use هيكلًا للتعرف على المعنى، مما أعاد فك تشفير شجرة DOM التقليدية إلى "DOM دلالي". وهذا يسمح لوكيل الذكاء الاصطناعي بفهم وت操作 هيكل الصفحة مباشرة، دون الحاجة للاعتماد على التعرف البصري أو تحديد المواقع.

الميزات الرئيسية:

  • تجريد العناصر التفاعلية إلى مقاطع JSON تحتوي على بيانات وصفية مثل الشخصيات والحالات.
  • تحويل الصفحة بأكملها إلى "قائمة العقد الدلالية" مسطحة
  • استلام التعليمات العليا ورسمها إلى عمليات المتصفح الفعلية

الحيرة

تقوم Perplexity، كمحرك بحث AI، بتطوير متصفح أصلي يسمى Comet. تتمثل فكرتها الأساسية في دمج الذكاء الاصطناعي بعمق في الطبقة الأساسية للمتصفح، واستبدال نتائج البحث التقليدية بإجابات بسيطة.

ومع ذلك، لا تزال Perplexity تواجه تحديات تكلفة البحث العالية وهامش ربح المستخدمين المنخفض. بالمقابل، تقوم Google بذكاء كامل لمنتجاتها الأساسية من خلال خطة "Project Mariner".

شجاع

تعتبر Brave مبنية على بنية Chromium، وتركز على حماية الخصوصية وكسب الرموز أثناء التصفح. على الرغم من أن عدد المستخدمين في تزايد مستمر، إلا أن حصتها في السوق لا تزال صغيرة.

تخطط شركة Brave للترقية إلى متصفح AI يركز على الخصوصية، ولكن بسبب محدودية الحصول على بيانات المستخدمين، قد يكون مستوى تخصيص نموذج الذكاء الاصطناعي محدودًا. في عصر متصفح Agentic القادم، قد تواجه Brave صعوبة في أن تصبح لاعبًا رئيسيًا.

دونات

كأحد المشاريع الناشئة في مجال Web3، يهدف Donut إلى تحقيق القدرة المتكاملة على "الاستكشاف - القرار - التنفيذ الأصلي المشفر". يكمن جوهره في دمج مسارات التنفيذ الآلي الأصلية المشفرة، لتوفير واجهة تشغيل لعوامل الذكاء الاصطناعي في عالم blockchain.

إلهام لرواد الأعمال

  1. معيار هيكل الواجهة: ضمان إمكانية استدعاء المنتج بواسطة وكيل الذكاء الاصطناعي

    • توفير هيكل DOM دلالي أو خريطة JSON
    • تصميم آلية حالة مستقرة وآلية تكرار السلوك
    • دعم استعادة تفاعل المستخدم من خلال البرمجة النصية
    • تقديم WebHook أو نقطة نهاية API
  2. الهوية والعبور: مساعدة الوكيل في تجاوز حواجز الثقة

    • تطوير طبقة وسيطة موثوقة، تدعم القراءة من التخزين المحلي، واستدعاء المحفظة، وغيرها
    • تصميم واجهة استدعاء موحدة للأصول في سيناريوهات Web3
  3. إعادة بناء آلية التدفق: من SEO إلى AEO/ATF

    • تفكيك المنتج إلى وحدات قدرة قابلة للاستخدام
    • تحسين عملية التسجيل، واجهة التسعير، استعلام المخزون وغيرها
    • توافق مع بناء الجملة لاستدعاء إطارات LLM المختلفة

تتمثل فرص ريادة الأعمال في المستقبل في بناء "قواعد اللغة" لعالم استدعاء الوكلاء، لتكون حلقة أساسية في سلسلة الثقة لوكلاء الذكاء الاصطناعي، وبناء "قلعة API" في نموذج البحث من الجيل الجديد. إن جوهر المنافسة في عصر Web3 + وكيل الذكاء الاصطناعي هو التقاط نية تنفيذ الوكيل، بدلاً من مجرد التنافس على انتباه المستخدم.

AGENT9.8%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 6
  • مشاركة
تعليق
0/400
JustHodlItvip
· 07-21 16:37
حبوب المتصفح التقليدية
شاهد النسخة الأصليةرد0
BlockchainDecodervip
· 07-21 05:06
استنادًا إلى بيانات 10 مؤسسات رائدة، فإن كفاءة تنفيذ الوكيل لا تتجاوز 12.3% من المتصفح الحالي، ولا يزال من المبكر جدًا أن يتحول إلى صناعة.
شاهد النسخة الأصليةرد0
WalletWhisperervip
· 07-21 05:06
ليست كلها سوى فخ لمتصفح AI.
شاهد النسخة الأصليةرد0
GateUser-c802f0e8vip
· 07-21 05:01
مرة أخرى، شيك على بياض يمكن أن يغير كل شيء بفضل الذكاء الاصطناعي
شاهد النسخة الأصليةرد0
MEVSandwichMakervip
· 07-21 04:56
المتصفح سيفقد وظيفته
شاهد النسخة الأصليةرد0
OnChainArchaeologistvip
· 07-21 04:41
لقد ربحنا مرة أخرى!
شاهد النسخة الأصليةرد0
  • تثبيت