Menu
Đăng ký
Truyện
← Trước Sau →
Truyen.Free

(Đã dịch) Duy Ta Độc Pháp: Ta Tại Đô Thị Tu Áo Thuật Pháp Sư - Chương 160: Đi trước đội bóng rổ trang cái bức ( Canh 1 )

“Quả Quýt... hắc hắc...” Trái Bưởi cười ngây ngô mấy tiếng, tiếng cười tràn đầy tình cảm.

Phương Dự nhìn thoáng qua Trái Bưởi. Theo một nghĩa nào đó, mô hình lớn này cũng có thể xem như đứa con của Trái Bưởi.

Không biết đứa con này có thể trưởng thành đến mức độ nào?

Ở tầng cốt lõi, mô hình lớn Quả Quýt không chỉ được tạo thành từ mạng lưới th���n kinh đa tầng mà còn ẩn chứa một phiên bản cấu trúc quy luật đơn giản hóa của chính Trái Bưởi, với hơn 300 triệu tham số. Chỉ riêng kích thước của mô hình đã vượt quá 10 GB.

300 triệu tham số, ở thời điểm hiện tại của năm 3061 (theo lịch tuần hoàn), là một quy mô vô cùng đáng kinh ngạc.

DeepMind mấy tháng trước vừa công bố số lượng tham số của Deep Q-Network cũng chỉ vỏn vẹn 1,68 triệu.

Còn hệ thống học sâu nhận diện khuôn mặt DeepFace, dù không công bố số lượng tham số, nhưng theo phỏng đoán, hẳn cũng chỉ vào khoảng hơn 10 triệu tham số.

Trong khi đó, ba năm trước, kế hoạch Đại Não Google (Google Brain Project) được công bố, sử dụng 16.000 CPU để huấn luyện, tuyên bố có 1 tỷ tham số, nhưng tỷ lệ tham số vô hiệu và tham số phụ trợ trong đó vượt quá 70%.

Mặc dù cũng đã thực hiện học tập không giám sát trên dữ liệu video, nhưng hiệu quả huấn luyện không tốt.

Tuy nhiên, mô hình lớn Quả Quýt lại hoàn toàn khác.

Bởi vì Trái Bưởi tự mình hoàn thành việc xây dựng khung mô hình lớn Quả Quýt bên trong bản thể của mình. Dưới sự h��� trợ của thuật toán, trong 300 triệu tham số của mô hình lớn Quả Quýt, số lượng tham số vô hiệu và tham số phụ trợ về cơ bản có thể kiểm soát dưới 10%!

Có thể nói, mô hình lớn Quả Quýt vừa ra đời chính là mô hình AI lớn có hiệu năng mạnh nhất thế giới hiện nay!

Tham số của mạng lưới thần kinh nhân tạo tương đương với các khớp thần kinh (synapse) trong não người.

Số lượng tham số là một trong những yếu tố quan trọng nhất, thậm chí là yếu tố quyết định, ảnh hưởng đến năng lực của mô hình trí tuệ nhân tạo.

Càng nhiều tham số thường có nghĩa là mô hình có khả năng biểu diễn cao hơn, có thể thu nhận và thể hiện các mô hình, mối quan hệ phức tạp hơn.

Nói một cách dễ hiểu, tham số càng nhiều, trí tuệ nhân tạo càng giống con người.

Hơn nữa, mô hình có nhiều tham số hơn có thể phù hợp hơn với dữ liệu huấn luyện, giảm thiểu sai sót trong quá trình huấn luyện.

Nói đơn giản là, tham số càng nhiều, khả năng phân tích của trí tuệ nhân tạo càng mạnh.

Xét về mặt tổng thể mà nói – tham số càng nhiều, năng lực trí tu��� nhân tạo càng mạnh, điều này là không sai.

Mặc dù hiện tại chỉ có 40 GB dữ liệu huấn luyện, nhưng mô hình lớn Quả Quýt đã thể hiện mức độ thông minh đáng kể.

Điều này cũng cho thấy, khung huấn luyện học sâu có hiệu suất cao mà Trái Bưởi tạo ra đã vượt xa phiên bản 0.5 của khung huấn luyện TensorFlow mà Google mới công bố một tháng trước.

Điều đáng chú ý là, khung huấn luyện trí tuệ nhân tạo và khung mô hình của trí tuệ nhân tạo lớn là hai thứ khác nhau.

Chẳng hạn như mô hình lớn Quả Quýt, các tầng mạng lưới thần kinh, cấu trúc cấp độ và phương thức kết nối mạng lưới thần kinh được sử dụng trong đó chính là khung mô hình của Quả Quýt.

Còn khung huấn luyện là một nền tảng phần mềm cung cấp các công cụ và giao diện để xây dựng, huấn luyện, đánh giá và triển khai các mô hình học sâu.

Nói một cách dễ hiểu, nếu khung mô hình lớn chưa được huấn luyện dữ liệu là một bộ óc hoàn toàn mới, thì khung huấn luyện chính là trường học, là giáo viên, và là toàn bộ hệ thống giáo dục.

Cấp độ và cấu trúc của bản thân khung mô hình AI lớn chính là trí thông minh tiềm ẩn của bộ óc hoàn toàn mới này.

Còn dữ liệu huấn luyện chính là kiến thức được hệ thống giáo dục truyền thụ cho bộ óc hoàn toàn mới này bằng nhiều phương pháp khác nhau.

Trình độ giáo viên khác nhau, hệ thống giáo dục khác nhau, kiến thức giảng dạy khác nhau, thì hiệu suất tiếp thu và độ chính xác của kiến thức mà học sinh nắm vững tự nhiên cũng khác nhau.

Thành tích của một học sinh tốt hay không, một mặt phụ thuộc vào trí thông minh và sự cố gắng cá nhân, mặt khác, cũng phụ thuộc vào phương thức giáo dục và hệ thống giáo dục có khoa học hay không, trình độ giảng dạy của giáo viên như thế nào.

Còn một khía cạnh khác là, nếu những kiến thức vốn dĩ sai lầm (dù được truyền đạt dưới dạng chính xác) được truyền thụ cho học sinh, thì chúng sẽ không có bất kỳ tác dụng nào trong thi cử và ứng dụng thực tế.

Tương tự, dữ liệu bị ô nhiễm, sai lệch cũng không thể dùng để huấn luyện một mô hình AI lớn có thể sử dụng. Việc sử dụng dữ liệu bị ô nhiễm để huấn luyện mô hình lớn sẽ dẫn đến mô hình lớn sau khi huấn luyện gần như không có giá trị thực tiễn nào.

Ba yếu tố này hỗ trợ lẫn nhau, thiếu một thứ cũng không được.

Nếu không thì nhà trong khu vực trường điểm sao có thể bán đắt như vậy?

Nếu không thì các lớp học thêm làm sao lại đắt đến thế?

“Trái Bưởi, với đơn vị là ba ngày, hãy sử dụng tài khoản của Trái Bưởi Khoa Kỹ để đăng tải dần dần các kỹ thuật khung huấn luyện sơ bộ lên GitHub theo trình tự đã định, lựa chọn giấy phép Apache 2.0.”

“Sau đó, viết ba bài luận văn liên quan đến cơ chế chú ý đa nhiệm, đồng dạng với tần suất mỗi tuần một lần, đăng lên arXiv.”

“Ngoài ra, trên GitHub, arXiv và LinkedIn, hãy tìm kiếm nhân tài kỹ thuật cao cấp ở trong nước Đại Chu, yêu cầu như sau...”

Phương Dự ban bố ba chỉ lệnh rõ ràng cho Trái Bưởi.

Cũng đã đến lúc tìm một đội ngũ kỹ thuật cho Trái Bưởi Khoa Kỹ. Nếu không, một công ty nhỏ với chỉ ba người đóng bảo hiểm xã hội như mình, đột nhiên lại tạo ra được một khung huấn luyện và một mô hình AI lớn hoàn thiện, ai c��ng sẽ không tin.

Với tư cách một công ty khởi nghiệp, làm sao mới có thể hấp dẫn nhân tài kỹ thuật cao cấp?

Rất đơn giản, chính là bản thân bạn phải là một nhân tài kỹ thuật cao cấp trước đã.

Thiên tài có hiệu ứng thu hút lẫn nhau.

Việc đưa những thứ này lên GitHub chính là mồi nhử.

Dù là Trái Bưởi hay mô hình lớn Quả Qu��t, chắc chắn đều sẽ được giữ kín. Phương Dự chuẩn bị bóc tách ra phần khung cơ bản nhất của mô hình lớn Quả Quýt, sau đó giao cho các thiên tài này lấp đầy và hoàn thiện. Nếu hiệu suất của mô hình đã bổ sung không bằng cái Trái Bưởi tạo ra, cậu ta sẽ tự mình sửa chữa.

Tóm lại, chỉ cần kiểm soát năng lực của mình ở mức thiên tài hàng đầu, đảm bảo những gì mình tạo ra không bị người khác nghi ngờ là được.

Trên thực tế, số lượng thành viên cốt lõi của một đội ngũ phát triển mô hình lớn và một đội ngũ cơ cấu huấn luyện thường không nhiều, có thể chỉ mười mấy người hoặc thậm chí chỉ vài người.

Bởi vậy, Phương Dự chỉ cần tuyển dụng ba đến năm nhà khoa học máy tính, năm đến mười kỹ sư, ba nhân viên xử lý dữ liệu, cộng thêm khoảng mười nhân viên vận hành, là hoàn toàn có thể vận hành đội ngũ mô hình lớn này.

Toàn bộ dự án hoàn toàn có thể kiểm soát nhân sự dưới 30 người.

Hơn nữa, ở khâu sản phẩm, Phương Dự không có ý định tuyển dụng bất kỳ người nước ngoài nào.

Cũng không phải Phư��ng Dự quá nặng tính dân tộc chủ nghĩa, chủ yếu vẫn là xuất phát từ yếu tố bảo mật.

Mọi người đều ở Đại Chu, nếu có bất kỳ sự cố nào xảy ra, hắn cũng có thể giải quyết nhanh chóng, nhưng nếu ở nước ngoài thì khá là phiền phức.

Nếu là những công ty khác, có lẽ còn phải lo lắng về việc khó tuyển dụng nhân tài hàng đầu ở Đại Chu.

Nhưng Trái Bưởi Khoa Kỹ thì không cần có vấn đề này. Bản thân Phương Dự muốn tìm là nhân tài cao cấp, chứ không phải nhân tài hàng đầu.

Nếu không phải bận tâm đến vấn đề thực tế, một mình hắn, phối hợp một đội ngũ tài chính và vận hành, chỉ dựa vào Trái Bưởi là có thể hoàn thiện sản phẩm, không cần bất kỳ ai khác phụ trợ, mà hiệu suất sẽ còn cao hơn.

Đến lúc đó, bộ phận duy nhất có thể cần nhiều nhân lực chính là bộ phận điều chỉnh AI. Nói trắng ra là để AI có thể điều chỉnh đạo đức của mình phù hợp với đạo đức xã hội loài người.

Bộ phận này không thể tiết kiệm nhân sự, cần phải có chuyên gia khoa học xã hội chuyên trách cùng một lượng lớn nhân viên ki��m thử, thông qua các cuộc đối thoại kỳ quặc, lạ lùng với AI để phát hiện các vấn đề đạo đức tồn tại trong AI, để phòng ngừa rủi ro.

Khoản này không thể tiết kiệm, ngay cả kiểm duyệt viên cũng không thể tiết kiệm.

Tuy nhiên, đây đều là chuyện sau này.

Trước đó, Phương Dự trước tiên cần phải tìm bộ phận nhân sự (HR) cho Trái Bưởi Khoa Kỹ.

À, không phải, trước tiên cần phải đi thể hiện ở đội bóng rổ đã.

Chương này tôi đã cố gắng hết sức để viết nội dung sâu sắc nhưng dễ hiểu, đã sửa đi sửa lại nhiều lần, nhưng vẫn giữ lại phần nội dung này.

Bởi vì phía sau có quá nhiều điều xoay quanh trí tuệ nhân tạo, vẫn phải cố gắng để mọi người có thể hiểu rõ mô hình AI lớn rốt cuộc là gì, nguyên lý hoạt động ra sao, và một trí tuệ nhân tạo ra đời như thế nào.

Những điều này không phải tác giả đang khoe khoang hay câu chữ lấp đầy, mà là muốn làm rõ, trong xã hội hiện thực, nếu nhân vật chính thực sự tạo ra một khung huấn luyện và một khung mô hình độc lập, làm thế nào để công bố mô hình này mà không b��� nghi ngờ, và làm thế nào để tối đa hóa lợi ích của mình từ góc độ chuyên môn.

Theo cách này, những tình tiết cao trào sau này mới có thể được đẩy lên một cách hợp lý.

Bản biên tập này thuộc bản quyền của truyen.free, xin vui lòng không sao chép dưới mọi hình thức.

Trước Sau
Nghe truyện
Nữ
Nam

Cài đặt đọc truyện

Màu nền:
Cỡ chữ:
Giãn dòng:
Font chữ:
Ẩn header khi đọc
Vuốt chuyển chương

Danh sách chương

Truyen.Free