Các đối thoại về LLM¶
LLM có năng lực cao?¶
Lập luận đánh giá cao năng lực của LLM | Phản hồi |
---|---|
Giúp đối thoại với tác giả | LLM không được xem là tác giả tri thức mới, vì nó không có khả năng chịu trách nhiệm đối với các tuyên bố tri thức, LLM không tất định mà tạo sinh kết quả mỗi lần mỗi khác dù với cùng một câu nhập, LLM không đọc được hàm ý |
Giúp tập trung vào sự sáng tạo hơn, bỏ qua các công việc lặp đi lặp lại | LLM không tất định mà tạo sinh kết quả mỗi lần mỗi khác dù với cùng một câu nhập. Nếu phải điều chỉnh lại kết quả của LLM thì tự làm luôn còn nhanh hơn |
Giúp code nhanh | Để LLM có thể tham gia vào việc lập trình được, nó cần phải làm được cả việc kiểm định và sửa lỗi code, chứ không phải chỉ mỗi sinh code |
Một số phản hồi chung khác:
- Muốn nói gì thì cứ lấy benchmark ra nói chuyện. Chatbot LLM nào cũng dẫn sai thông tin khoảng 60%. Riêng Grok là tới 96%
- Đằng sau vẻ ngoài tự trị của LLM là những người làm công việc dán nhãn và kiểm duyệt, vô hình và bếp bênh
- Khi một AI thực sự hữu ích, ta không còn gọi nó là AI
- Tiềm năng để kiếm tiền từ AI đến từ mảng học có giám sát nhiều hơn ở mảng tạo sinh
- Sự không phân biệt giữa AI học có giám sát và AI tạo sinh mà chỉ gộp chung vào AI làm nhiều người nhầm lẫn giữa điểm mạnh và điểm yếu của AI. Nên dùng khái niệm LLM cho loại AI đa số người dùng biết đến
-
Nếu LLM thay thế được nhân viên, thì nó cũng thay thế được quản lý
- Cartography of generative AI
LLM giúp tóm tắt nhanh chóng?¶
- Tại sao không đi kiếm những bài tóm tắt do người viết?
- Giả sử như không có ai viết tóm tắt thì có bằng chứng nào cho thấy là nó tóm tắt ở mức chấp nhận được không? Liệu nó chỉ tóm tắt tốt với các bài đơn giản? Các bài kiểm tra năng lực tóm tắt của nó cho kết quả như thế nào?
Xem thêm các ghi chú về chủ đề Tóm tắt, mục lục:
- Tóm tắt nội dung bài giảng, dùng bút đánh dấu đoạn văn bản quan trọng khi đọc sách, đọc đi đọc lại một chương sách hoá ra lại là những cách không mấy hiệu quả về ghi nhớ
- Tinh túy của một cuốn sách chính là mục lục của nó
- Việc rút gọn cả bài thành câu tóm tắt chỉ có tác dụng khi mình hiểu dược những khái niệm quan trọng trong bài
- Đọc mục lục một cuốn sách thì đơn giản, nhưng có thể truy xuất được điều mình cần và vận dụng nó một cách hiệu quả thì phải đọc cả cuốn sách
LLM có năng lực thấp?¶
Khi một người đưa ra nhận định rằng LLM có năng lực thấp thì họ thường nhận những phản hồi gì?
Phản hồi mà người đánh giá thấp năng lực LLM nhận được | Phản hồi về phản hồi |
---|---|
Thấy nó dở là vì không chịu bỏ tiền để dùng cái xịn | Những lập luận ở mục LLM có năng lực cao? không loại trừ những mô hình tốn tiền. Ngoài ra, lập luận rằng do chưa trải nghiệm nên không có tư cách nhận xét cũng không khác gì lập luận của những người tin vào thuyết trái đất phẳng |
Thấy nó dở là vì không biết cách làm chủ | Bản chất việc làm chủ là viết prompt. Những lập luận ở mục LLM có năng lực cao? không loại trừ việc viết prompt tốt. Cơ bản, dù dùng prompt gì đi nữa thì Nếu phải điều chỉnh lại kết quả của LLM thì tự làm luôn còn nhanh hơn |
Công nghệ hôm nay là thứ tệ nhất trong tương lai. Nó sẽ phát triển theo hàm lũy thừa. Mà Chúng ta không quen thuộc với luỹ thừa | Có bằng chứng cho thấy việc có thêm dữ liệu và phần cứng để tính toán cũng không làm tăng khả năng nhận diện |
LLM không thay thế được con người, nhưng người biết xài LLM sẽ thay thế họ | Quay về lại năng lực của LLM. Ngoài ra có những loại máy tốt hơn nhưng cái dở hơn vẫn chưa bị thay thế |
Đừng kỳ vọng LLM cao quá rồi dẫn tới thái cực cực đoan khác là coi thường nó | Vậy có thể tôi đã sai khi cho rằng việc dùng nó là kém hiệu quả trong tất cả các công việc. Nhưng với loại công việc tôi đang làm thì tôi vẫn chưa thấy nó hiệu quả, vì nó đòi hỏi độ chính xác trong tất cả các khâu. Nếu phải điều chỉnh lại kết quả của LLM thì tự làm luôn còn nhanh hơn. Thứ làm tôi khó chịu với LLM là vì nó được tiếp thị như là một giải pháp hoàn hảo có thể giải quyết được mọi nhu cầu thực tế. Khi một AI thực sự hữu ích, ta không còn gọi nó là AI |
Quan sát về đa số các bài trình bày giới thiệu về LLM¶
- Chỉ tóm tắt cuốn sách nổi tiếng và đã nhiều người đã tóm tắt rồi
- Xem việc tạo ra được câu trả lời với số lượng từ lớn là chất lượng
- Không nói đến giọng văn, cá tính cá nhân của tác giả
- Chỉ giới thiệu các dịch vụ LLM mà không nói về bản chất của LLM
- Khi giới thiệu các dịch vụ LLM thì không đánh giá chất lượng sản phẩm mà chỉ nói tính năng
- Chỉ đưa ra ví dụ chung chung, không đưa ra ví dụ mà chính họ làm mà đạt được
Cần:
- Đánh giá chất lượng, so sánh với khi không dùng LLM
- Trả lời vào các lập luận ở trên
- Trả lời trực tiếp vào các framework cho prompt, các mô hình sử dụng con người trong quy trình vận hành
Đừng quên động lực của các công ty¶
- Nếu LLM được huấn luyện có chọn lọc, nó có thể bị bẻ theo ý của người tạo ra nó. Nếu LLM được huấn luyện không chọn lọc, nó có thể bị bẻ bởi các chiến dịch tuyên truyền
- Sự không phân biệt giữa AI học có giám sát và AI tạo sinh mà chỉ gộp chung vào AI làm nhiều người nhầm lẫn giữa điểm mạnh và điểm yếu của AI
- Việc làm cho LLM như có thêm cảm xúc khiến ta dễ bị lệ thuộc vào chúng hơn
- Việc xem LLM là học được cho phép các công ty đòi quyền cung cấp dữ liệu
- Việc có được cách phân biệt một sản phẩm là do LLM tạo ra hay không một cách tin cậy được không chỉ giúp người dùng mà còn giúp chính các LLM đó
- Việc xem LLM có nhân tính sẽ tạo thêm rào cản để lên án chúng
- Việc tích hợp LLM vào sản phẩm là để bán lời hứa cho nhà đầu tư, không phải để bán sản phẩm cho người dùng
- Việc LLM được thiết kế như chat khiến ta không để ý rằng nó chỉ là tự động điền chữ
Nơi thảo luận¶
Mục lục¶
-
-:
-
Chủ thể tính:
- Con người có xu hướng đánh đồng việc nói chuyện trôi chảy và việc suy nghĩ
- LLM không lao động để cải tạo thế giới
- Chủ thể tính
- LLM không được xem là tác giả tri thức mới, vì nó không có khả năng chịu trách nhiệm đối với các tuyên bố tri thức
- Nếu LLM thay thế được nhân viên, thì nó cũng thay thế được quản lý
- Người sử dụng LLM không thể tự nhận mình là tác giả của tác phẩm do nó tạo ra được, vì nghệ thuật đòi hỏi ta phải đưa ra rất nhiều lựa chọn
- Tranh do LLM vẽ không thể hiện được mối quan hệ giữa tác giả và thứ được vẽ
- Đằng sau vẻ ngoài tự trị của LLM là những người làm công việc dán nhãn và kiểm duyệt, vô hình và bếp bênh
- Sự khác biệt giữa con người và mô hình ngôn ngữ lớn là con người có niềm tin và có thể kiểm chứng niềm tin từ môi trường bên ngoài
-
Động cơ của công ty:
- Nếu LLM được huấn luyện có chọn lọc, nó có thể bị bẻ theo ý của người tạo ra nó. Nếu LLM được huấn luyện không chọn lọc, nó có thể bị bẻ bởi các chiến dịch tuyên truyền
- Sự không phân biệt giữa AI học có giám sát và AI tạo sinh mà chỉ gộp chung vào AI làm nhiều người nhầm lẫn giữa điểm mạnh và điểm yếu của AI
- Việc làm cho LLM như có thêm cảm xúc khiến ta dễ bị lệ thuộc vào chúng hơn
- Việc xem LLM là học được cho phép các công ty đòi quyền cung cấp dữ liệu
- Việc có được cách phân biệt một sản phẩm là do LLM tạo ra hay không một cách tin cậy được không chỉ giúp người dùng mà còn giúp chính các LLM đó
- Việc xem LLM có nhân tính sẽ tạo thêm rào cản để lên án chúng
- Việc tích hợp LLM vào sản phẩm là để bán lời hứa cho nhà đầu tư, không phải để bán sản phẩm cho người dùng
- Việc LLM được thiết kế như chat khiến ta không để ý rằng nó chỉ là tự động điền chữ
-
Giới hạn:
- Có bằng chứng cho thấy việc có thêm dữ liệu và phần cứng để tính toán cũng không làm tăng khả năng nhận diện
- Các lỗi cơ xương và lực này thường thấy ở các cảnh hành động xuất bởi AI
- LLM không đọc được hàm ý
- LLM không tất định mà tạo sinh kết quả mỗi lần mỗi khác dù với cùng một câu nhập
- LLM không học. Nó chỉ được tối ưu hoá trong một tập điều kiện
- LLM là định dạng ảnh mờ của web
- Chatbot LLM nào cũng dẫn sai thông tin khoảng 60%. Riêng Grok là tới 96%
- Các LLM thương mại sẽ có chất lượng giảm dần do bị huấn luyện từ dữ liệu của LLM
- Với các lệnh vẽ hình, nó sẽ được điều chỉnh trước khi đi tới chương trình vẽ
- Shadow prompting means that genuine users cannot discover real biases in the model, or any constraints imposed on the model to mitigate those biases
- LLM gần như không có khả năng tự sửa lỗi code
- Khi nào các công ty LLM không còn tuyển lập trình viên nữa thì lúc đó nó mới đủ khả năng code
- Để LLM có thể tham gia vào việc lập trình được, nó cần phải làm được cả việc kiểm định và sửa lỗi code, chứ không phải chỉ mỗi sinh code
- Người mới học nên bắt đầu bằng việc hiểu code đúng hơn là sửa lỗi code sai với lời hướng dẫn chưa chắc đúng
- Trước khi LLM có thể kiểm định và sửa lỗi code, ta vẫn cần phải học lập trình để kiểm định và sửa lỗi cho nó
- Mô hình không tồn tại sau khi học xong. Con người đã tồn tại trước khi học
- Mô hình ngôn ngữ lớn làm việc với ngôn ngữ, không phải kiến thức
- Nếu phải điều chỉnh lại kết quả của LLM thì tự làm luôn còn nhanh hơn
- Lợi thế của các trang tài nguyên cộng đồng là ở chỗ nó được tạo bằng con người. Vì nếu nó được tạo bằng LLM thì người ta chẳng cần vào đó
- Ta chỉ cần tự động hoá những thứ ta có thể làm mà không cần nghĩ
- Bài kiểm tra Turing được thiết kế cho những thứ biết nghĩ, không phải cho thứ không biết nghĩ
- Con người xem mệnh đề phủ định nằm ở hướng đối lập. LLM xem là kế bên
- Cách để LLM không bị ảo giác là kêu nó viết truy vấn cho Wikidata
- Không có sự chính xác thì giống như lái xe trong sương mù
- Khả năng tự hoàn thiện nằm ở việc nghĩ được về việc nghĩ của mình
- LLM nhất thiết không được luôn lựa chọn từ tiếp theo có xác suất xuất hiện cao nhất, nếu không sẽ không tạo ra sự tự nhiên nữa
- Tất cả các tác phẩm viễn tưởng từ trước tới nay đều vẽ về một nhân vật AI không có ảo giác
- Việc truy xuất thông tin cần có accuracy, sourcing, consistency, and fragility. LLM không có những thứ đó
- Ảo giác ở người thể hiện sự trục trặc. Ảo giác ở LLM thể hiện nó hoạt động đúng chức năng
- Ở con người, sự chính xác vẫn có thể tồn tại trong lúc sáng tạo. Ở LLM, khi đã làm nó chính xác thì nó không thể ngẫu nhiên nữa
- Nếu như LLM không thể thay thế tư duy của con người, thì người không dùng LLM luôn có lợi thế về tư duy với người sử dụng
-
Tiềm năng:
- LLM làm rất tốt việc gợi ý từ khoá
- Thế mạnh của LLM là làm những công việc cần tốc độ mà không đòi hỏi sự chính xác, chất lượng
- AGI không thể được tạo bởi LLM, vì các kiến thức mới là ngôn ngữ nhỏ
- AI giống như công nghệ tua bin. Gắn nó với xe hơi thì không sử dụng được. Nhưng nếu có thể có thêm những công nghệ mới thì có thể thành máy bay
Mô tả vấn đề | Giải pháp | |
---|---|---|
Chuẩn hoá | Dữ liệu không được phân loại | Dán nhãn thủ công |
Hệ thống hoá | Silo thông tin khiến cho những thao tác tự động hoá đơn giản không thể làm được | |
Số hoá | Phần mềm | |
Tự động hoá | Tự động hoá các công việc lặp đi lặp lại |
Chưa nói gì về chuẩn hoá, hệ thống hoá, số hoá, tự động hoá
Những thứ chưa trả lời được¶
Học lập trình¶
tut thì dài và ko trả lời câu hỏi của mình đc :v, và tìm content chất lượng cũng khó, hỏi AI thì nó trả lời đúng cái b đang cần, kiến thức nó cũng có nhiều do nó cũng học dữ liệu từ tut trên mạng chứ đâu
Bẻ nhỏ công việc
Dùng LLM để tạo ra multiple soltion path và tổng hợp lại cái tốt nhất
Cái văn phong. Mà hành văn theo đúng văn phong của mình thì nó có vẻ chấn động với mình hơn. Cài cắm các tình tiết
B1: hiểu hồn thơ
Các bài test về quy trình này
có đáng để
những cái đó vẫn là cái người ta đã làm rồi
sop
mục tiêu của việc viết bài là gì
nó break down ra rồi thì làm gì tiếp với nó
giúp phân tích pattern của mình
tìm được các blindspot của mình
capture sự nhảy cóc giống topic modelling -> nhân văn số
❓Nếu như tất cả LLM đều là nhận dạng pattern, thì dùng topic modelling sẽ nhanh hơn
LLM chỉ phát huy tác dụng khi có một bối cảnh đủ lớn
có một ngàn kiểu tóm tắt khác nhau
- Tóm tắt lược đi thông tin
- Tms tắt giữ tính nguyên bản. dài hơn thành súc tích hơn
- khái quát hoá khái niệm
- visualize
(1) thực hiện từng bước rồi mới chuyển sang bước tiếp theo
(2) input , process (task đang làm), ouput chất lượng - review đánh giá xem đạt chất lương chưa và sửa lại nếu cần thiết
toàn bộ cuộc nói chuyện chỉ theo một framework thôi