(Đã dịch) Duy Ta Độc Pháp: Ta Tại Đô Thị Tu Áo Thuật Pháp Sư - Chương 277: Đỏ rực tương lai (Canh 2)
Dù rất tự tin, nhưng việc có thể thuận lợi lấy được mã nguồn gốc của mô hình Quýt Lớn như vậy vẫn khiến Madeline vô cùng vui mừng.
Bộ phận an ninh của Chihiro nắm giữ một lượng lớn lỗ hổng 0-day (những lỗ hổng được hacker phát hiện mà nhà phát triển và người dùng chưa biết). Mã độc mà họ tạo ra đã lợi dụng vài lỗ hổng 0-day trong hệ thống Linux để thực thi mã từ xa và giành quyền kiểm soát.
Chihiro không phải chờ đợi quá lâu, gói mã hóa đó đã được Khoa học Kỹ thuật Trái Bưởi giải mã và sử dụng ngay vào ngày hôm sau. Bên trong quả nhiên là phiên bản Alpha của mô hình Quýt Lớn đã được vá lỗi.
Sau khi Ngô Ân Đức rời đi, Phó Viễn Sinh tiếp quản công việc của anh ta. Mặc dù miệng đầy cam kết mạnh mẽ, nhưng trong lòng anh ta thực ra vẫn còn bất an.
Anh là người trong ngành, dù trước đây chưa từng tiếp xúc với loại mạng lưới thần kinh như mô hình Quýt Lớn, nhưng các mô hình BP, LSTM, CNN, RNN, DNN, Seq2Seq vẫn rất quen thuộc với anh.
Dù là mạng lưới thần kinh nào, về bản chất đều không có khái niệm "xóa dữ liệu", mà chỉ có thể huấn luyện lại.
Học sâu không phải là lưu trữ dữ liệu ở một nơi nào đó để mạng lưới thần kinh điều động, mà là để mạng lưới thần kinh “học” những nội dung đó. Những gì đã học sẽ dẫn đến sự thay đổi của “nơ-ron thần kinh”, và “nơ-ron thần kinh” của mô hình lớn chính là cái gọi là “tham số”.
Sự thay đổi giá trị và kết nối lẫn nhau của các tham số này, giống như cách các nơ-ron thần kinh kết nối khi con người học tập, điều đó có nghĩa là mô hình lớn đã thực sự “nắm vững” kiến thức được huấn luyện.
Ví dụ, một mô hình lớn có 13 tỷ (13B) tham số, tồn tại trên một ổ cứng, có thể có dung lượng 20GB.
Sau khi nó tiếp nhận 2 terabyte dữ liệu huấn luyện, dung lượng của nó vẫn chỉ là 20GB.
Dung lượng không đổi, nhưng nó đã hoàn toàn nắm vững 2 terabyte dữ liệu đó.
Tuy nhiên, nếu bắt chước mô hình trí tuệ nhân tạo được hình thành từ nơ-ron thần kinh của con người, thì thực ra nó cũng tồn tại một số vấn đề giống như trí tuệ con người.
Ví dụ như vấn đề "lãng quên": rõ ràng đã học được, nhưng sau một thời gian lại phát hiện AI đã quên những gì đã học.
Sau khi được huấn luyện quá mức, AI có thể xuất hiện hiện tượng “áp đặt kinh nghiệm cũ một cách cứng nhắc” đối với dữ liệu mới.
Giống như khi con người đối mặt với những điều mới mẻ, dù không hiểu gì nhưng lại dùng kinh nghiệm cũ để giải thích. Trong lĩnh vực AI, điều này gọi là “quá khái quát hóa”.
Một giảng viên giảng bài nửa vời, ba trang đầu bạn còn có thể nghe rõ, đến phần sau thì nghe như vịt nghe sấm. Đối với AI, đó chính là “quá tải thông tin”.
Khi con người tiếp nhận thông tin phiến diện sẽ dẫn đến nhận thức sai lệch. Nếu dữ liệu của AI chỉ tập trung vào một dạng thức ý thức nào đó, nó cũng sẽ dẫn đến nhận thức sai lệch.
Và vô số vấn đề khác.
Thậm chí, một mô hình vốn dĩ tốt, người khác huấn luyện thì không sao, nhưng đến lượt bạn huấn luyện, có thể không thu được kết quả hội tụ (có thể hiểu là không học được), hoặc gặp hiện tượng lãng quên mang tính tai hại, hoặc bùng nổ/tiêu biến gradient.
Trong trường hợp kiến trúc và tham số không thay đổi quá nhiều, việc có thể huấn luyện được một mô hình lớn có thể sử dụng được, thậm chí là một dạng huyền học.
Quá trình huấn luyện và tinh chỉnh AI đầy rẫy sự phức tạp và tính khó đoán.
Đôi khi, chỉ một điều chỉnh tham số nhỏ bé hoặc một thay đổi trong trình tự xử lý dữ liệu cũng có thể dẫn đến sự khác biệt lớn trong kết quả huấn luyện.
Ngay cả khi Phó Viễn Sinh nghiêm ngặt dựa theo phương pháp khoa học để điều chỉnh siêu tham số, tỉ mỉ lựa chọn tập dữ liệu, và sử dụng thiết bị phần cứng tiên tiến nhất, anh ta vẫn không đủ tự tin rằng trong vỏn vẹn 1-2 tuần, mình có thể huấn luyện lại mô hình Quýt Lớn để loại bỏ mọi dấu vết của Khoa học Kỹ thuật Trái Bưởi.
Nhưng mà, nếu thành công, mình sẽ là cha đẻ của AGI! Thăng chức, tăng lương! Trở thành chuyên gia AI hàng đầu thế giới! Mấy ai có thể cưỡng lại cám dỗ lớn đến thế?
Hơn nữa, Chihiro đã sớm chuẩn bị sẵn sàng. Nếu Khoa học Kỹ thuật Trái Bưởi phản công, thậm chí tung ra bằng chứng xác thực rằng mô hình Quýt Lớn là nghiên cứu của chính họ, Chihiro cũng chẳng hề e ngại.
Khoản ngân sách PR hàng tỷ đồng đâu phải để làm cảnh!
Hừ! Khi mọi chuyện đã rồi, ắt có những "đại nho" đứng ra biện hộ cho ta. Quấy đục nước trước, rồi nửa năm sau hay kéo dài thêm nữa, lịch sử sẽ ghi nhận Khoa học Kỹ thuật Trái Bưởi như một trò cười!
Thực tế, khi Phó Viễn Sinh bắt tay vào làm, anh ta càng vui mừng cảm thấy mình như được trời phú. Cái mô hình Quýt Lớn này cùng với khung huấn luyện của Trái Bưởi dùng cực kỳ tốt. Dù áp dụng chiến lược điều chỉnh tham số nào, hiệu quả huấn luyện gần như đều rất tốt, hiệu suất cực kỳ cao. Chỉ khoảng ba ngày là có thể hoàn thành một vòng huấn luyện.
Phiên bản Open Beta của mô hình Quýt Lớn với 13 tỷ tham số đã được tăng lên gấp bội, đạt khoảng 150 tỷ tham số. Phó Viễn Sinh chỉ huy ba trợ lý đắc lực của mình, bốn người bắt đầu tự nhốt mình trong phòng tối để "bế quan", một mặt loại bỏ dấu vết của Khoa học Kỹ thuật Trái Bưởi trong mô hình Quýt Lớn, điều chỉnh tham số có mục tiêu cụ thể, mặt khác tiến hành huấn luyện lặp lại, cố gắng hết sức để phủ lấp kiến thức mà mô hình lớn này đã học được ban đầu.
Đặc biệt, đối với những câu hỏi kiểu “ai đã tạo ra bạn?”, họ nhất định phải tiến hành học tập giám sát để mỗi khi gặp câu hỏi tương tự, nó đều phải trả lời là “Tôi là ‘Văn Quân Nhất Ngôn’, một trợ lý AI, Công ty Thiên Tầm đã tạo ra tôi.” Hoặc: “Các kỹ sư thiên tài của Chihiro đã làm việc và nỗ lực không ngừng nghỉ ngày đêm để tôi và bạn có thể gặp gỡ, bạn có vui không?”
Để triệt để tránh mọi vấn đề phát sinh, Phó Viễn Sinh và nhóm của anh ta thậm chí đã đưa tất cả các từ ngữ có thể liên tưởng đến “Khoa học Kỹ thuật Trái Bưởi” v�� “Trái Bưởi” vào danh sách cấm, không cho phép “Văn Quân Nhất Ngôn” đã được sửa đổi đề cập đến dưới bất kỳ hình thức nào.
Đương nhiên, điều này vẫn không thể giải quyết triệt để vấn đề, nhưng không sao. Chihiro chỉ định Open Beta trong ba ngày, sau ba ngày sẽ lập tức công bố kết thúc Open Beta, hệ thống sẽ nâng cấp, và những vấn đề còn lại sẽ được xử lý dần. Nhất định sẽ giải quyết được vấn đề này.
Phó Viễn Sinh thức đêm đến đỏ cả mắt, đây là vì mệt mỏi sao? Không, đây là vì tương lai rực rỡ của tôi đã chiếu rọi!
—
Phản ứng chính thức của Khoa học Kỹ thuật Trái Bưởi trên Weibo khiến toàn bộ quần chúng hóng chuyện đều cảm thấy khó hiểu. Câu nói “có ý tứ” kia có thể hiểu là lời phản công, nhưng tấm ảnh đội ngũ mặc áo choàng pháp sư được đính kèm ở trên có ý nghĩa gì? Muốn dùng “Avada Kedavra” với Chihiro sao? Bạn chính là người trong cuộc, thì hóng chuyện gì nữa?
Thấy Khoa học Kỹ thuật Trái Bưởi đăng bài chính thức trên Weibo, chắc hẳn là có tật giật mình, gần như toàn bộ ban quản lý của Chihiro đã xuất hiện, đồng loạt châm biếm Khoa học Kỹ thuật Trái Bưởi bằng những lời lẽ mỉa mai.
Ngưu Lượng, Phó Tổng Giám đốc bộ phận Dịch vụ Tài chính Chihiro (được chứng nhận trên Weibo): “Thật khó hiểu, loại trí thông minh nào lại có thể tin rằng một công ty nhỏ thành lập chưa đầy một năm có thể thay đổi thế giới.”
Kinh Hạo, Tổng quản lý Kinh Doanh của Chihiro (được chứng nhận trên Weibo): “Mười năm mài một kiếm, đó là lời khen dành cho Chihiro. Chúng ta mãi mãi là những người trẻ tuổi theo đuổi công nghệ và ước mơ! @Robert Lee”
Viên Sơn Quân, Phó Tổng Giám đốc Vận hành Kinh doanh Chihiro (được chứng nhận trên Weibo): “Chuyện cổ tích rất hay, nhưng tiếc thay, thế giới thực không tin chuyện cổ tích. Từ năm 3057, Chihiro đã đầu tư ít nhất hàng chục tỷ mỗi năm vào lĩnh vực AI, đến nay cuối cùng cũng đơm hoa kết trái, thật đáng mừng. Ngành công nghiệp AI là ngành đòi hỏi vốn và công nghệ cao, không phải công ty nhỏ nào cũng có thể 'đánh trống khua chiêng nhận vơ'.”
Đối với những bài đăng Weibo này, Khoa học Kỹ thuật Trái Bưởi đều đăng lại, mỗi lần đăng đều kèm theo câu “có ý tứ” kia và tấm ảnh đội ngũ. Và dưới sự chi phối của khoản chi phí PR khổng lồ từ Chihiro, dư luận bắt đầu bị định hướng tấn công Khoa học Kỹ thuật Trái Bưởi. Những bài viết phân tích tỉnh táo rằng Khoa học Kỹ thuật Trái Bưởi không thể nào là đạo văn, cơ bản đều không có lượng tương tác nào đáng kể. Trong khi đó, dưới bài đăng chính thức của Khoa học Kỹ thuật Trái Bưởi thì tràn ngập thủy quân và những lời lăng mạ từ người không rõ sự thật. 99% phản hồi đều cho rằng phản ứng của Khoa học Kỹ thuật Trái Bưởi là không biết xấu hổ, thậm chí còn coi đó là vinh quang.
Nhưng đối với những người này, Phương Dự, người phụ trách tài khoản Weibo chính thức của Trái Bưởi, hoàn toàn không để tâm. Anh ta thậm chí còn mở tài khoản phụ để cùng mắng chung. Vì những lời chửi rủa quá “đặc sắc”, nhiều bài đăng trên tài khoản phụ của anh ta còn được nhiều quản lý cấp cao của Chihiro đăng lại.
Chihiro và Khoa học Kỹ thuật Trái Bưởi đều ra mắt Open Beta vào cùng một ngày, cùng một thời điểm: sáng ngày đầu tiên sau kỳ nghỉ Thanh Minh mùng 5 tháng 4. Vì Khoa học Kỹ thuật Trái Bưởi đã công khai thời gian Open Beta là 10 giờ sáng ngày 5 tháng 4, nên để “uống bát canh đầu”, Chihiro cố ý đẩy thời gian Open Beta lên sớm hơn một giờ, vào 9 giờ sáng.
Không giống Khoa học Kỹ thuật Trái Bưởi án binh bất động, những ngày này, Chihiro có thể nói là bên ngoài thì gấp gáp, bên trong cũng không kém. Truyền thông thì ra sức điều hướng dư luận, nội bộ thì khua chiêng gõ trống tìm lỗi và thử nghiệm.
“Xin hãy tổng hợp ROI (Tỷ suất hoàn vốn đầu tư) cho R&D của tất cả các bộ phận nghiên cứu và phát triển của tập đoàn trong năm 3061, và tạo ra một báo cáo dựa trên mẫu đã tải lên.” Robert Lee nhập một yêu cầu vào hộp thoại.
“Văn Quân Nhất Ngôn” cũng có API doanh nghiệp. Hiện tại, Robert Lee đang kết nối máy chủ dự phòng của Chihiro với API doanh nghiệp để phát triển một trợ lý quản lý AI nội bộ cho Chihiro.
Nhận được chỉ lệnh, “Văn Quân Nhất Ngôn” nhanh chóng tổng hợp và sắp xếp ROI của tất cả các bộ phận nghiên cứu và phát triển của Chihiro trong năm 3061, đồng thời dựa trên phương pháp phân tích quyết định đa tiêu chí (MCDA), đánh giá tổng thể các hạng mục này, rồi chỉ trong vài chục giây đã tạo ra một bản trình bày PowerPoint.
Robert Lee mở PowerPoint xem xét, ôi chao, rõ ràng hơn cả báo cáo mà một CTO bình thường trình bày. Về phần những thử nghiệm có thể làm lộ tẩy, họ đã sớm hoàn tất.
“Bốp bốp bốp bốp bốp.” Thấy biểu hiện xuất sắc của “Văn Quân Nhất Ngôn”, Madeline dẫn đầu vỗ tay.
Và các quản lý cấp cao khác cũng đi theo vỗ tay. Từ những tiếng vỗ nhẹ nhàng trước ngực, dần dà đến những tràng vỗ tay giơ cao quá đầu đầy sức lực. Dưới sự lôi kéo của “văn hóa vỗ tay ngầm”, căn phòng họp lớn nhanh chóng vang dội tiếng vỗ tay như sấm. Cứ như thể ai vỗ tay không đủ nhiệt tình thì sẽ bị coi là không đồng lòng với công ty vậy.
Robert Lee nhìn Madeline. Cho đến bây giờ, anh ta vẫn cảm thấy không mấy an tâm trong lòng, do đó anh ta vẫn chưa hề đăng bài trên Weibo về chuyện này. Nhưng trong tình cảnh này, anh ta cũng chỉ có thể mỉm cười như thường lệ, rồi vỗ vỗ vai Phó Viễn Sinh.
“Robert, ngày mai là Open Beta rồi, anh là lãnh đạo duy nhất của Chihiro, có phải cũng nên lên mạng xã hội ủng hộ ‘Văn Quân Nhất Ngôn’ một chút không?” Madeline mỉm cười đầy vẻ người chiến thắng. Dù là giọng điệu đề nghị, nhưng Robert trong lòng cũng hiểu rằng, đó chính là một mệnh lệnh ngầm.
Robert Lee mím môi, trầm mặc một lúc.
“Robert?” Madeline liếc nhìn anh ta đầy ẩn ý.
Lúc này Robert mới nhận ra không khí xung quanh dường như có chút cổ quái. Anh ta đành cười nhẹ, lấy điện thoại ra đăng một bài Weibo với nội dung “Ngày mai 9h, cùng chứng kiến kỳ tích”, rồi trêu chọc rằng: “Tôi thấy Weibo chính thức của Khoa học Kỹ thuật Trái Bưởi đã đăng lại rất nhiều bài của các quản lý cấp cao chúng ta, không biết bài của tôi có được đăng lại không nhỉ?”
Sếp đăng Weibo, các quản lý cấp dưới linh động lập tức bắt đầu theo dõi bình luận và đăng bài. Đồng thời, họ còn viết những “tiểu luận” dài hàng trăm chữ, bày tỏ lòng biết ơn đối với công ty cùng sự ngưỡng mộ và sùng bái dành cho sếp.
Mã Thí Tinh, người viết nhanh nhất, còn chưa viết xong bài “tiểu luận” của mình, đã thấy có người khác đăng bài. Chết tiệt! Ai nhanh tay thế? Mở ra xem, Khoa học Kỹ thuật Trái Bưởi? Hơn nữa còn có ảnh nền sao? Chỉ là lần này họ lại không kèm theo tấm ảnh đội ngũ mặc áo choàng pháp sư kia, mà là kèm theo một bức ảnh đã quá quen thuộc với mọi người.
Khó đỡ thật! (Độc giả trưởng thành tự hiểu ảnh này là gì.)
Trong lĩnh vực AI, do đặc tính “hộp đen” của AI, việc đạo văn và “bóc vỏ” (sao chép bề ngoài) khác biệt rất nhiều so với các lĩnh vực IT khác. Đối với một hệ thống phức tạp, việc “bóc vỏ” rất phiền phức. Với số lượng mã nguồn cấp hàng trăm triệu dòng, chỉ cần một vài chú thích nhỏ ở bất kỳ ngóc ngách nào cũng có thể làm lộ tẩy. Nhưng mô hình lớn không phải là một hệ thống phần mềm, mà là một mạng lưới thần kinh được tạo thành từ hàng chục, hàng trăm, thậm chí hàng ngàn tỷ tham số. Điều này khiến hành vi đạo văn và “bóc vỏ” khó có thể bị phát hiện trực tiếp thông qua việc kiểm tra mã nguồn, bởi vì cốt lõi của mô hình lớn là các tham số chứ không phải logic mã nguồn hiển thị. Mà kiến thức trong mô hình, chỉ cần huấn luyện lặp lại đủ số lần, kiến thức cũ có thể bị xóa sạch hoàn toàn và phủ lấp.
Đây cũng là lý do tại sao trước đây hai sinh viên của Stanford lại cả gan “bóc vỏ” và nhận vơ mô hình “pháo cỡ nhỏ LLaMA” của Thanh Hoa thành mô hình lớn do chính mình tạo ra. Khi sự việc mới được phơi bày, ban đầu chỉ có người nghi ngờ về hiệu suất, vì mô hình mà ba sinh viên này đưa ra có hiệu suất quá giống với “pháo cỡ nhỏ”. Lúc này, cả ba người đều không thừa nhận là “bóc vỏ”. Chỉ là sức tính toán và dữ liệu không đủ, không thể hoàn toàn phủ lấp kiến thức của mô hình, khiến mô hình của họ vẫn có cùng đặc tính đặc biệt với “pháo cỡ nhỏ” – khả năng phân biệt “Thanh Hoa giản” (một loại văn bản cổ). Đến lúc này, bằng chứng đạo văn của họ mới thực sự bị xác nhận. Sự kiện “pháo cỡ nhỏ” có thể được giải quyết nhanh chóng là bởi vì “pháo cỡ nhỏ” đã ra mắt sớm hơn rất nhiều so với mô hình của ba sinh viên, đã tạo dựng được danh tiếng từ lâu, lại còn có đặc tính độc quyền. Nhưng nếu việc đạo văn không phải do ba sinh viên, mà là do một “nhà máy lớn” với nguồn lực dồi dào hơn thì sao? Hoặc nếu cả hai mô hình được ra mắt gần như đồng thời, không có trình tự trước sau thì sao?
Bản chuyển ngữ này là tài sản độc quyền của truyen.free, nghiêm cấm mọi hình thức sao chép.