Ngành AI đang bước vào chiến trường mới: từ cuộc tranh giành khả năng tính toán đến việc định giá lại dữ liệu chú thích.

robot
Đang tạo bản tóm tắt

Chiến trường mới của ngành AI: từ cuộc tranh giành khả năng tính toán đến việc định giá lại giá trị của việc gán nhãn dữ liệu

Gần đây, trong lĩnh vực AI đã xảy ra một sự kiện đáng chú ý: một ông lớn công nghệ đã chi 14,8 tỷ USD để mua gần một nửa cổ phần của một công ty gán nhãn dữ liệu. Hành động này đã gây ra một cơn chấn động lớn tại Silicon Valley, nhiều người cho rằng ông lớn này đã định giá lại việc gán nhãn dữ liệu với một mức giá trên trời. Trong khi đó, một số dự án Web3 AI vẫn đang nỗ lực thoát khỏi cái mác "thổi phồng khái niệm". Phía sau sự tương phản lớn này, thị trường thực sự đã bỏ qua điều gì?

Thực tế, việc đánh dấu dữ liệu có giá trị hơn việc tổng hợp khả năng tính toán phi tập trung. Mặc dù câu chuyện về việc sử dụng GPU nhàn rỗi để thách thức các ông lớn trong lĩnh vực điện toán đám mây nghe có vẻ hấp dẫn, nhưng khả năng tính toán về bản chất là một hàng hóa tiêu chuẩn hóa, sự khác biệt chủ yếu nằm ở giá cả và tính khả dụng. Lợi thế về giá có vẻ như có thể tìm kiếm cơ hội trong sự độc quyền của các ông lớn, nhưng tính khả dụng bị hạn chế bởi phân bố địa lý, độ trễ mạng và các yếu tố khác, một khi các ông lớn giảm giá hoặc tăng cung, lợi thế này sẽ nhanh chóng biến mất.

So với đó, việc gán nhãn dữ liệu là một lĩnh vực khác biệt cần sự thông minh và phán đoán chuyên nghiệp của con người. Mỗi gán nhãn chất lượng cao đều chứa đựng kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, không thể được sao chép theo cách tiêu chuẩn hóa như khả năng tính toán của GPU. Ví dụ, một gán nhãn chẩn đoán hình ảnh ung thư chính xác cần trực giác chuyên nghiệp của bác sĩ ung thư dày dạn, một phân tích cảm xúc thị trường tài chính dày dạn không thể thiếu kinh nghiệm thực chiến của các nhà giao dịch phố Wall. Tính khan hiếm và không thể thay thế tự nhiên này mang lại cho việc gán nhãn dữ liệu chiều sâu bảo vệ vượt xa khả năng tính toán.

Gần đây, một gã khổng lồ công nghệ đã chính thức công bố việc mua lại 49% cổ phần của một công ty gán nhãn dữ liệu với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI trong năm nay. Điều đáng chú ý hơn là, người sáng lập và CEO của công ty gán nhãn dữ liệu này sẽ đồng thời đảm nhiệm vị trí trưởng phòng nghiên cứu "Siêu trí tuệ" mới được thành lập của gã khổng lồ công nghệ này.

Doanh nhân gốc Hoa 25 tuổi này đã thành lập công ty vào năm 2016 khi còn là một sinh viên bỏ học tại Đại học Stanford, và hiện tại công ty mà anh quản lý đã đạt giá trị 30 tỷ USD. Danh sách khách hàng của công ty được coi là "đội hình toàn sao" trong lĩnh vực AI: nhiều công ty công nghệ nổi tiếng, nhà sản xuất ô tô, thậm chí cả các cơ quan chính phủ đều là đối tác lâu dài của công ty. Công ty chuyên cung cấp dịch vụ gán nhãn dữ liệu chất lượng cao cho việc đào tạo các mô hình AI, với hơn 300.000 nhân viên gán nhãn được đào tạo chuyên nghiệp.

Khi mọi người còn đang tranh luận xem mô hình của ai có hiệu suất tốt hơn, những người chơi thực sự đã âm thầm chuyển chiến trường sang nguồn dữ liệu. Một cuộc "chiến tranh ngầm" về quyền kiểm soát tương lai của AI đã bắt đầu.

Sự thành công của công ty gán nhãn dữ liệu này tiết lộ một sự thật bị bỏ qua: Khả năng tính toán không còn khan hiếm, cấu trúc mô hình có xu hướng đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu đã được "huấn luyện" tỉ mỉ. Một ông lớn công nghệ không mua một công ty gia công với giá trên trời, mà là "quyền khai thác dầu" của thời đại AI.

Tuy nhiên, câu chuyện của sự độc quyền luôn có những kẻ nổi loạn. Giống như nền tảng tổng hợp khả năng tính toán đám mây cố gắng lật đổ các dịch vụ điện toán đám mây tập trung, một số dự án Web3 AI đang cố gắng sử dụng blockchain để viết lại hoàn toàn các quy tắc phân phối giá trị của việc gán nhãn dữ liệu. Điểm yếu chết người của mô hình gán nhãn dữ liệu truyền thống không phải là vấn đề công nghệ, mà là vấn đề thiết kế động lực.

Ví dụ, một bác sĩ dành vài giờ để gán nhãn hình ảnh y tế, có thể chỉ nhận được vài chục đô la tiền công, trong khi mô hình AI được đào tạo từ những dữ liệu này có giá trị hàng tỷ đô la, bác sĩ lại không nhận được một xu nào. Sự phân phối giá trị cực kỳ bất công này đã kìm hãm nghiêm trọng ý muốn cung cấp dữ liệu chất lượng cao.

Và với sự thúc đẩy của cơ chế khuyến khích token Web3, những người tham gia sẽ không còn là "công nhân nông nghiệp" dữ liệu rẻ mạt, mà là những "cổ đông" thực sự của mạng lưới mô hình ngôn ngữ AI. Rõ ràng, lợi thế của Web3 trong việc chuyển đổi quan hệ sản xuất thể hiện rõ hơn trong bối cảnh gán nhãn dữ liệu.

Thú vị là, một dự án Web3 AI đúng lúc diễn ra sự kiện tạo token tại thời điểm mua lại với giá trên trời này, đây là sự trùng hợp hay là một kế hoạch được dày công chuẩn bị? Theo quan điểm của tác giả, điều này thực sự phản ánh một bước ngoặt của thị trường: bất kể là Web3 AI hay AI truyền thống, cả hai đã từ "cuộc đua khả năng tính toán" chuyển sang "cuộc đua chất lượng dữ liệu".

Khi các ông lớn truyền thống xây dựng rào cản dữ liệu bằng tiền bạc, Web3 đang xây dựng một thí nghiệm "dân chủ hóa dữ liệu" lớn hơn bằng kinh tế token. Cuộc cạnh tranh về tương lai của AI có thể khốc liệt và phức tạp hơn chúng ta tưởng.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 2
  • Chia sẻ
Bình luận
0/400
SchrodingerWalletvip
· 08-05 20:36
Đồ ngốc chơi đùa với mọi người xong lại mọc mới.
Xem bản gốcTrả lời0
MoonlightGamervip
· 08-05 20:24
Tôi luôn cảm thấy có điều gì đó không ổn với đĩa này.
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)