BizLab: Liang Wen Feng & DeepSeek – Khuấy đảo thị trường trí thông minh nhân tạo

by Huyền My Trương
February 6, 2025

Không chỉ dừng ở việc cạnh tranh trong lĩnh vực kinh tế mà hai cường quốc Mỹ – Trung đã và đang cùng nhau tiến bước trong cuộc giao tranh dài hơi trong lĩnh vực công nghệ. Nếu OpenAI – ChatGPT đã khuấy đảo cộng đồng số trong năm 2022 thì đến năm 2024, ngay dịp Tết Nguyên Đán, sự xuất hiện của DeepSeek đã tạo sự đổi thay trong cán cân này.

Được Liang Wen Feng thành lập vào tháng 12 năm 2023, DeepSeek đã ra mắt mô hình ngôn ngữ lớn AI đầu tiên của mình vào năm sau. Mô hình do Trung Quốc phát triển, được cho là có giá cả phải chăng hơn so với các đối tác phương Tây, đã chứng kiến sự gia tăng đột biến về lượt tải xuống trên toàn thế giới.

DeepSeek đang làm chao đảo giới công nghệ với mô hình suy luận R1. Được phát triển với chi phí chỉ bằng một phần nhỏ so với các mô hình AI hiện tại, R1 vẫn đạt hiệu suất ấn tượng, thậm chí được đánh giá là vượt trội hơn hẳn. Điều này đã khiến cổ phiếu của nhiều ông lớn công nghệ, trong đó có cả Nvidia, lao dốc một cách nhanh chóng.

Khác với OpenAI hay Google DeepMind, DeepSeek được nuôi dưỡng bằng chính lợi nhuận từ quỹ đầu cơ của Liang. Ông không gọi vốn bên ngoài, cũng không vội thương mại hóa sản phẩm. Thay vào đó, Liang dùng tiền từ High-Flyer để chiêu mộ nhân tài AI hàng đầu Trung Quốc, trả lương cao ngang ByteDance – công ty sở hữu TikTok.

Đây thật sự là một làn sóng với thị trường công nghệ hiện đại – nơi những ông lớn “đổ tiền tỷ” đầu tư vào AI. Hàng tỷ đô là con số có thể tạm ước tính cho chi phí bỏ ra ban đầu nếu một doanh nghiệp muốn theo đuổi con đường này. Tuy nhiên với Liang Wen Feng, nhà sáng lập DeepSeek – người vốn lớn lên tại một gia đình giản dị có cha là giáo viên, được nuôi dưỡng niềm đam mê giữa toán học, điện toán và hành vi thị trường trong thời gian theo học ngành kỹ thuật điện tử tại Đại học Chiết Giang, đã đặt ra ý niệm cho bản thân “Nhiều tiền đầu tư hơn không có nghĩa là nhiều đổi mới hơn”. Đây cùng là triết lý và giá trị cốt lõi để anh cùng cộng sự sáng lập ứng dụng này với giá trị cốt lõi – tối ưu hóa, phát triển các phương pháp mới giúp đạt hiệu quả tương đương với lượng tài nguyên ít hơn đáng kể.

Giảm chi phí suy luận xuống 1/7 so với GPT-4; chất lượng có thể đạt 9/10 so với ChatGPT Pro mà không phải trả phí; chỉ mất khoảng 6 triệu USD chi phí đào tạo với các mô hình V3/R1 nhưng một số tính năng không thua kém sản phẩm AI hàng đầu; như sự phản tỉnh với dự án Stargate dự kiến vốn đầu tư hơn 500 tỷ USD vào cơ sở hạ tầng AI tại Mỹ là những điều thương hiệu này đạt được trong thời gian không tới 1 tháng.

Dó đó, các nhà đầu tư công nghệ thật sự đặt dấu chấm hỏi lớn cho việc “hạn chế nguồn lực và chip, vốn đầu tư thấp” vẫn có khả năng khuấy đảo thị trường. Trước tình thế này, Mỹ đã bật “báo động đỏ” nhằm ngăn DeepSeek tiếp cận đến các chip công nghệ cao của Nvidia – đơn vị cung cấp chip cho các nhà phát triển trí thông minh nhân tạo lớn trên thế giới.

Tuy nhiên, có thật sự việc đầu tư một nguồn chi phí thấp và việc đánh giá hiệu suất thông qua những tác vụ đơn giản của người dùng sẽ là tất cả trong bài toán mà người làm đầu tư về AI cần phải giải? Yann LeCun, Giám đốc AI của Meta đã đưa ra nhận định về việc so sánh các công ty Mỹ chi hàng tỷ USD vào AI với DeepSeek – “Có sự hiểu lầm lớn về đầu tư cơ sở hạ tầng AI. Phần lớn trong số hàng tỷ USD đó được đầu tư vào cơ sở hạ tầng để suy luận, không phải để đào tạo”. Sự thật, mô hình mới là yếu tố tiên quyết trong câu chuyện trí thông minh nhân tạo này, không thể chỉ đánh giá ở mặt tối ưu chi phí sản xuất mà AI phải có khả năng xử lý được các tác vụ phức tạp – điều mà các doanh nghiệp và người dùng thật sự cần. Đây sẽ là câu chuyện cần nhiều thời gian và chất xám để giải quyết không thể dựa trên những đánh giá cơ sở khi một mô hình chỉ mới xuất hiện trong thời gian ngắn.

Với tầm nhìn về AGI – không phải bằng sức mạnh tính toán khổng lồ, mà bằng sự khám phá phương pháp luận, Liang Wen Feng và DeepSeek đã thật sự tạo ra mối đe dọa đến thị trường độc quyền của OpenAI và ChatGPT nhưng mô hình này có khả năng thay thế hoặc vượt lên những mô hình hiện có hay không sẽ cần thời gian làm sáng tỏ.

Trong một bài đăng trên mạng xã hội, CEO Sam Altman của OpenAI đã bày tỏ sự ấn tượng với những gì DeepSeek đạt được. Altman gọi R1 là “một mô hình ấn tượng, đặc biệt là về những gì họ có thể mang lại với mức giá đó”.

Tuy nhiên, Altman cũng khẳng định OpenAI sẽ không chịu thua kém. Ông cho biết công ty sẽ sớm ra mắt những mô hình tốt hơn và xem DeepSeek như một động lực để thúc đẩy sự phát triển. “Chúng tôi thực sự cảm thấy sảng khoái khi có một đối thủ cạnh tranh mới!”, CEO Altman chia sẻ.

Tựu trung, cuộc chiến về trí thông minh nhân tạo sẽ là cuộc chiến về thời gian và nguồn lực, những gì DeepSeek làm hiện tại hứa hẹn tạo ra một thị trường đầy cạnh tranh mà ở đó người tiêu dùng sẽ là người được hưởng lợi nhiều nhất từ cuộc chiến này.

BizLab: Liang Wen Feng & DeepSeek – Khuấy đảo thị trường trí thông minh nhân tạo

Bài: Thùy Linh

Ảnh: Tổng hợp

The Latest

Nhà thiết kế Nguyễn Tiến Truyển ghi dấu tại Tuần lễ thời trang Paris Haute Couture

Xu hướng giày thể thao Retro lên ngôi năm 2025

Làn gió mới trong ẩm thực thành phố cảng

Samsung Galaxy Z Fold7 & Galaxy Z Flip7 – 2 siêu phẩm “gập mở” định hình tương lai mới

library

Pages

Categories