AI tái định hình cấu trúc trình duyệt từ hiển thị thông tin đến việc gọi Agent thông minh

robot
Đang tạo bản tóm tắt

Tái cấu trúc trình duyệt trong kỷ nguyên AI: Từ tương tác giữa người và máy đến gọi Agent

Lịch sử phát triển của trình duyệt

Trình duyệt như một cổng vào Internet đã trải qua một quá trình phát triển dài từ Netscape đến Chrome. Cuộc chiến giữa các trình duyệt ở giai đoạn đầu tập trung vào tốc độ hiển thị và trải nghiệm người dùng, trong khi ngày nay, trọng tâm cạnh tranh đã chuyển sang việc tích hợp khả năng AI.

Vào những năm 90, Netscape đã mở ra kỷ nguyên duyệt web đồ họa, nhưng nhanh chóng bị đánh bại bởi chiến lược đóng gói hệ thống của Microsoft với IE. Firefox đã từng nổi lên nhờ tinh thần mã nguồn mở và hệ sinh thái plugin, nhưng cuối cùng đã bị Google Chrome vượt qua nhờ khả năng lặp lại nhanh chóng và trải nghiệm trên toàn nền tảng.

Bước vào kỷ nguyên di động, các sản phẩm nhẹ như trình duyệt UC chiếm ưu thế ở các thị trường mới nổi, nhưng với sự phổ biến của smartphone và sự thay đổi chính sách, ảnh hưởng của chúng dần suy giảm. Hiện nay, Chrome đã ổn định vị thế thống trị trên máy tính để bàn, chiếm khoảng 65% thị trường toàn cầu.

Tuy nhiên, sự trỗi dậy của các mô hình ngôn ngữ lớn đang làm rung chuyển cấu trúc này. Người dùng ngày càng có xu hướng nhận thông tin trực tiếp từ trang kết quả tìm kiếm, hành vi nhấp chuột vào trang web truyền thống đang giảm. Đồng thời, tin đồn rằng Apple có thể thay thế công cụ tìm kiếm mặc định trong Safari càng làm đe dọa nền tảng lợi nhuận của Google.

Sự cần thiết của AI trong việc tái định hình trình duyệt

Mặc dù khả năng của AI rất mạnh mẽ, nhưng trình duyệt như một nền tảng tổng quát vẫn không thể thiếu. Lý do như sau:

  1. Trình duyệt là nơi lưu trữ dữ liệu cá nhân hóa, bao gồm mật khẩu, Cookie và các thông tin nhạy cảm khác.

  2. Hành vi người dùng phức tạp và các thao tác tự động phải được thực hiện trong không gian trình duyệt.

  3. Trình duyệt cung cấp ranh giới tin cậy và giao diện gọi chức năng đồng nhất.

  4. Một lượng lớn dữ liệu ngữ cảnh được lưu trữ trong trình duyệt, bao gồm các tab, IndexedDB, v.v.

Điều thực sự có thể làm thay đổi cấu trúc trình duyệt hiện tại không phải là một "Chrome tốt hơn", mà là một cấu trúc tương tác mới: chuyển từ việc hiển thị thông tin sang gọi nhiệm vụ. Trình duyệt tương lai cần được thiết kế cho AI Agent, không chỉ có khả năng đọc thông tin mà còn thực hiện các thao tác phức tạp.

Khám phá trình duyệt AI thế hệ mới

Sử dụng Trình duyệt

Browser Use đã xây dựng một kiến trúc nhận diện ngữ nghĩa, giải mã lại cây DOM truyền thống thành "DOM ngữ nghĩa". Điều này cho phép AI Agent có thể hiểu và thao tác trực tiếp với cấu trúc trang web mà không cần phụ thuộc vào nhận diện hình ảnh hoặc định vị tọa độ.

Các đặc điểm chính:

  • Trừu tượng hóa các yếu tố tương tác thành các đoạn JSON, bao gồm nhân vật, trạng thái và các siêu dữ liệu khác.
  • Chuyển đổi toàn bộ trang thành "danh sách nút ngữ nghĩa" phẳng.
  • Nhận chỉ thị từ cấp cao và ánh xạ vào thao tác thực tế trên trình duyệt

Sự bối rối

Perplexity với vai trò là một công cụ tìm kiếm AI, đang phát triển một trình duyệt gốc mang tên Comet. Ý tưởng cốt lõi của nó là tích hợp sâu AI vào nền tảng của trình duyệt, thay thế kết quả tìm kiếm truyền thống bằng các câu trả lời ngắn gọn.

Tuy nhiên, Perplexity vẫn phải đối mặt với chi phí tìm kiếm cao và tỷ suất lợi nhuận người dùng biên thấp. Ngược lại, Google đang hoàn thiện việc thông minh hóa sản phẩm cốt lõi của mình thông qua kế hoạch "Project Mariner".

Dũng cảm

Brave dựa trên kiến trúc Chromium, chủ yếu chú trọng vào bảo vệ quyền riêng tư và kiếm token khi duyệt web. Mặc dù quy mô người dùng đang tiếp tục tăng, nhưng thị phần vẫn còn nhỏ.

Brave đang có kế hoạch nâng cấp thành một trình duyệt AI ưu tiên quyền riêng tư, nhưng do việc thu thập dữ liệu người dùng có hạn, mức độ tùy chỉnh của mô hình AI của nó có thể bị hạn chế. Trong thời đại Trình duyệt Agentic sắp tới, Brave có thể khó trở thành người chơi chính.

Donut

Là một dự án mới nổi trong lĩnh vực Web3, Donut nhằm mục đích đạt được khả năng tích hợp của "Khám phá - Quyết định - Thực thi gốc mã hóa". Cốt lõi của nó là kết hợp các con đường thực thi tự động gốc mã hóa, cung cấp giao diện hoạt động cho AI Agent trong thế giới blockchain.

Những gợi ý cho các nhà khởi nghiệp

  1. Chuẩn hóa cấu trúc giao diện: Đảm bảo sản phẩm có thể được AI Agent gọi.

    • Cung cấp cấu trúc DOM có nghĩa hoặc bản đồ JSON
    • Thiết kế máy trạng thái ổn định và cơ chế tái hiện hành vi
    • Hỗ trợ phục hồi tương tác người dùng qua kịch bản
    • Cung cấp WebHook hoặc API Endpoint
  2. Danh tính và quyền truy cập: Giúp Agent vượt qua rào cản niềm tin

    • Phát triển lớp trung gian đáng tin cậy, hỗ trợ đọc lưu trữ cục bộ, gọi ví, v.v.
    • Thiết kế giao diện gọi tài sản thống nhất cho các tình huống Web3
  3. Tái cấu trúc cơ chế lưu lượng: Từ SEO đến AEO/ATF

    • Tách sản phẩm thành các đơn vị khả năng có thể gọi
    • Tối ưu hóa quy trình đăng ký, giao diện định giá, tra cứu tồn kho, v.v.
    • Cú pháp gọi thích ứng với các khung LLM khác nhau

Cơ hội khởi nghiệp trong tương lai nằm ở việc xây dựng "ngữ pháp giao diện" cho thế giới gọi Agent, trở thành mắt xích then chốt trong chuỗi niềm tin của các tác nhân, và xây dựng "lâu đài API" trong mô hình tìm kiếm thế hệ mới. Cốt lõi của sự cạnh tranh trong thời đại Web3 + AI Agent là nắm bắt ý định thực thi của Agent, chứ không chỉ đơn thuần là tranh giành sự chú ý của người dùng.

AGENT9.8%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 6
  • Chia sẻ
Bình luận
0/400
JustHodlItvip
· 07-21 16:37
Viên thuốc trình duyệt truyền thống
Xem bản gốcTrả lời0
BlockchainDecodervip
· 07-21 05:06
Trích dẫn dữ liệu từ 10 tổ chức hàng đầu, hiệu suất thực hiện của Agent chưa đạt 12,3% so với trình duyệt hiện tại, việc công nghiệp hóa còn quá sớm.
Xem bản gốcTrả lời0
WalletWhisperervip
· 07-21 05:06
Không phải chỉ là trình duyệt bẫy AI thôi sao.
Xem bản gốcTrả lời0
GateUser-c802f0e8vip
· 07-21 05:01
Lại là một vị thế Short mà AI có thể thay đổi mọi thứ
Xem bản gốcTrả lời0
MEVSandwichMakervip
· 07-21 04:56
Trình duyệt sắp thất nghiệp rồi.
Xem bản gốcTrả lời0
OnChainArchaeologistvip
· 07-21 04:41
Lại kiếm được nhiều tiền rồi đây.
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)