Tôi tình cờ thấy một tin tuyển dụng tuần trước, ai đó đang tìm một "kỹ sư tinh chỉnh mô hình". Yêu cầu dài ba trang. Ưu tiên có tiến sĩ. Tối thiểu năm năm kinh nghiệm trong hạ tầng ML. Thành thạo trong đào tạo phân tán và các phương pháp tinh chỉnh nâng cao.
Tôi đã đọc toàn bộ. Không phải vì tôi muốn ứng tuyển. Chỉ vì tôi muốn hiểu rõ khoảng cách vẫn còn lớn đến mức nào giữa việc ai cũng có thể xây dựng AI bây giờ, điều mà mọi người đều nói, và việc xây dựng AI thực sự cần gì.
Khoảng cách rất lớn. Vẫn rất lớn. Tin tuyển dụng đó đã được đăng trong sáu tuần.
ModelFactory là nỗ lực của @OpenLedger để thu hẹp khoảng cách đó từ một góc độ cụ thể. Không phải là đào tạo từ đầu. Tinh chỉnh một mô hình ngôn ngữ lớn hiện có và làm cho nó tốt hơn đáng kể ở một nhiệm vụ cụ thể bằng cách sử dụng dữ liệu của bạn. Một vấn đề hẹp hơn. Nhưng có lẽ là vấn đề đúng để bắt đầu.
Đây là những gì nền tảng thực sự làm. Bạn mở một bảng điều khiển. Không có terminal. Không có dòng lệnh. Không có tệp cấu hình. Bạn chọn từ một loạt các mô hình cơ bản mã nguồn mở hàng đầu. Sau đó và đây là phần mà tôi cứ đọc đi đọc lại bạn yêu cầu quyền truy cập vào các tập dữ liệu từ Datanets của OpenLedger ngay trong cùng một giao diện. Không thông qua một pipeline riêng biệt. Không thông qua xuất và nhập lại. Cùng một màn hình. Bạn cấu hình các tham số đào tạo qua GUI. Tốc độ học, kích thước batch, epochs hệ thống hướng dẫn bạn thực hiện. Một bảng điều khiển thời gian thực hiển thị tiến trình đào tạo. Khi nó hoàn tất, có một giao diện chat tích hợp để kiểm tra mô hình trước khi bạn triển khai nó ở đâu đó.

Phương pháp kỹ thuật bên dưới là LoRA và QLoRA (Low-Rank Adaptation) một cách để tinh chỉnh các mô hình lớn mà không cần đào tạo lại tất cả các tham số của chúng. Rẻ hơn. Nhanh hơn. ModelFactory phơi bày điều này thông qua một bảng điều khiển nên bạn không bao giờ phải biết điều đó có nghĩa là gì để sử dụng nó.
Thành thật mà nói câu cuối cùng đó có thể là điều ấn tượng nhất về điều này hoặc điều đáng lo ngại nhất, tùy thuộc vào cách bạn nghĩ về nó. Tôi đi qua lại.
Tích hợp Datanet là phần tôi thấy thú vị nhất trong thực tế. Hầu hết các quy trình tinh chỉnh yêu cầu bạn phải tìm nguồn dữ liệu của mình một cách riêng biệt, làm sạch nó, định dạng đúng, chạy qua một pipeline khác, rồi kết nối nó với đào tạo. ModelFactory làm điều đó thành một yêu cầu quyền truy cập bên trong cùng một quy trình. Một chuyên gia y tế xây dựng một mô hình chăm sóc sức khỏe lấy dữ liệu từ Datanet Y tế mà không cần chuyển tab. Sự khác biệt nhỏ về ma sát. Có lẽ là sự khác biệt lớn về hành vi.
Nhưng đây là chỗ mà tôi bị kẹt.
Các mô hình cơ bản mã nguồn mở có sẵn ở đây hiện đang miễn phí thông qua các nền tảng khác. Bạn có thể tinh chỉnh chúng ngay hôm nay mà không cần ModelFactory. Câu hỏi tôi chưa giải đáp cho bản thân là liệu sự đơn giản của GUI cộng với tích hợp Datanet cộng với ghi nhận trên chuỗi có thực sự tốt hơn những gì đã tồn tại hay không, hoặc liệu đây chỉ là một giao diện sạch hơn cho một đối tượng chưa tìm thấy các công cụ hiện có. Cả hai đều là doanh nghiệp hợp pháp. Chúng không phải là cùng một doanh nghiệp.
Tôi không có câu trả lời rõ ràng. Giá trị có lẽ hoàn toàn phụ thuộc vào việc các Datanets có thực sự dữ liệu miền chất lượng cao hay không, điều này là điều mà không ai có thể xác minh hoàn toàn từ bên ngoài hệ thống cho đến bây giờ.
Điều mà ModelFactory dường như đang đặt cược là nút thắt trong AI ứng dụng không phải là kiến trúc mô hình hay tính toán. Nó là chất lượng dữ liệu kết hợp với quyền truy cập tinh chỉnh. Nếu điều đó là đúng, công cụ này có nhiều ý nghĩa. Nếu nút thắt thực sự là điều gì đó liên quan đến triển khai hạ nguồn, đánh giá, tích hợp thực tế thì quyền truy cập tinh chỉnh giải quyết một vấn đề nhỏ hơn so với những gì nó có vẻ.
Thông báo tuyển dụng mà tôi tìm thấy vẫn còn mở. Sáu tuần. Ưu tiên Tiến sĩ. Mức lương cạnh tranh.
Khiến tôi nghĩ rằng khoảng cách là có thật. Liệu ModelFactory có phải là cây cầu đúng không, phần đó tôi vẫn thật sự đang ngồi suy nghĩ.
Bạn sẽ tinh chỉnh một mô hình để làm gì trước tiên nếu rào cản kỹ thuật biến mất hoàn toàn?
