Đưa trí thông minh của con người vào máy tính
Phép thử Turing
ChatGPT
Trí tuệ nhân tạo
Tâm lý học
Các luật hợp thức
Ngôn ngữ liên quan như thế nào tới ý nghĩ?
Số lượng lõi và tốc độ xung nhịp của bộ vi xử lý
Cơ sở dữ liệu trực tuyến
Trong các lĩnh vực như y tế, tài chính và thương mại điện tử
Lập trình để thực hiện một hoặc một số lượng giới hạn các công việc
Có ý thức tự nhận thức và giải quyết vấn đề, học hỏi và lập kế hoạch cho tương lai
Siêu trí tuệ nhân tạo (Artificial Super Intelligence) có thể làm gì?
Suy nghĩ hợp lý, hành động hợp lý, suy nghĩ như người, hành động như người
AI yếu, AI mạnh, AI cực mạnh
Robot, Hệ chuyên gia, Xử lý ngôn ngữ tự nhiên
Có thể thực hiện các thao tác một cách độc lập
Chuẩn đoán chính xác người bệnh và lên phương án điều trị độc lập
Các vật dụng trong nhà như máy giặt, bếp nấu
Thị giác máy tính
Trong tội phạm, AI được dùng để xác định tội phạm trước khi họ thực hiện các hành vi phạm tội
Dùng để đánh giá mức độ chính xác của một hệ thống AI
AI mạnh có thể làm được các công việc như người, AI yếu chỉ có thể làm được các vấn đề-hành động đơn lẻ, cụ thể
1950
Vượt qua phép thử Turing
1956
Giúp máy tính suy nghĩ và hành động giống như con người
Thập niên 1950
Apple
Chatbot
Giảm chi phí do giúp tinh giản quy mô doanh nghiệp.
Python chỉ được các nhà khoa học dữ liệu có nhiều năm kinh nghiệm sử dụng
Dữ liệu, Con người, Phần cứng, Phần mềm, Quy trình
John McCarthy
Học máy, học sâu, xử lý ngôn ngữ tự nhiên, và thị giác máy tính
Ước lượng về khả năng dẫn đến lời giải
AI yếu
Học máy là một bộ các kỹ thuật nằm trong học sâu
Hệ thống Siri trong iOS
Không sử dụng thông tin Heuristics
Là tập tất cả các trạng thái của bài toán
Là chuỗi các trạng thái theo thứ tự tìm kiếm từ trạng thái bắt đầu đến trạng thái đích
Mở rộng các nút biên
Tính đầy đủ, tính tối ưu, tính hiệu quả
Tốc độ tìm kiếm và giá thành tìm kiếm
2
Tìm kiếm có thông tin, dùng A* hoặc tìm kiếm tham lam
Phương pháp tìm kiếm theo chiều sâu tìm theo bề dọc của cây tìm kiếm, trong khi phương pháp tìm kiếm theo chiều rộng tìm theo bề ngang của cây tìm kiếm
Định hướng quá trình tìm kiếm
Phương pháp tìm kiếm tham lam nhanh hơn A* nếu xét cùng bài toán và hàm heuristic
Tìm kiếm A*
Hàm heuristic h(n) ước lượng giá trị từ điểm n tới điểm đích, h(n) phải có giá trị lớn hơn giá trị thực tế từ n tới đích
Mặc dù các bài toán thực tế có không gian tìm kiếm lớn, tìm kiếm mù vẫn là một phương pháp được sử dụng do có độ phức tạp tính toán và yêu cầu bộ nhớ thấp
Tìm kiếm có thông tin
Gặp trạng thái đích đã được định nghĩa trước đó
Các tham số, chuỗi các hành động để đạt trạng thái đích
Chiều sâu
Leo đồi
DFS
Heuristic
Nút gốc.
Sử dụng ngăn xếp.
Khá tự nhiên, gần gũi với cách suy nghĩ và hành động của con người.
BFS
Leo đồi sẽ duyệt tất cả các hướng đi có thể và chọn đi theo trạng thái tốt nhất trong số các trạng thái kế tiếp của nó
A-> B-> E-> G
A-> B-> E-> G
A-> C-> D-> F->G->H->K
A, B, C, D, E, G
A, B, C, D, E, F, G, H, K
A, B, D, F, E, C, G
Tìm kiếm theo chiều sâu
Giá trị f=g+h
Có (A)
Duyệt tất cả các đỉnh.
Giải thuật A*.
Nút gốc
Không gian trạng thái là tập tất cả các trạng thái có thể có của bài toán
A, B, C, D, E, G
S, A, D, C, B
Gốc của cây
Nhanh chóng tìm ra kết quả
Phải lưu toàn bộ các trạng thái
Chỉ lưu lại các trạng thái chưa xét đến
Vết dầu loang
Vét toàn bộ (vét cạn)
Là một cấu trúc phân cấp của các nút và các nhánh
2 tính chất
Không nên
Là một thuật toán phát triển các nút chưa xét các theo chiều sâu nhưng có giới hạn mức.
Tìm kiếm sâu dần.
Lặp lại tất cả các công việc của giai đoạn trước.
Cạnh
Kích thước của dữ liệu đầu vào của thuật toán
Là phương pháp duyệt không gian trạng thái chỉ sử dụng các thông tin theo phát biểu của bài toán tìm kiếm tổng quát trong quá trình tìm kiếm.
1968
Có thể phụ thuộc vào lựa chọn trước đó.
Học máy
Học củng cố, học có giám sát, học không có giám sát
Phân loại
Để xác định độ tin cậy của mô hình
Giá dầu mỏ
Để xác định mối liên hệ giữa các đặc trưng trong dữ liệu
Dữ liệu dán nhãn có thể được dùng cho cả học có giám sát và không có giám sát
Logo
Dự đoán kết quả bóng đá
Giải pháp tính thời lượng kiểm soát bóng của mỗi đội bóng trong một trận đấu
Mô hình học máy có thể được học liên tục
Dữ liệu học dùng để điều chỉnh các tham số của thuật toán và đánh giá mức độ tin cậy của mô hình
Học chủ động
Sử dụng dữ liệu đa dạng và phong phú cho quá trình học
Mô hình học máy
Là một vấn đề thường gặp trong học máy và có ảnh hưởng nhiều tới độ chính xác của các kỹ thuật học máy.
Phân cụm
3
Phân lớp và Hồi quy
Phân nhóm
Học tăng cường
Cả A và B
Học máy
Học không có giám sát
Phân cụm và Học tăng cường.
Tập dữ liệu huấn luyện
Kinh nghiệm
Bằng cách thử và sai
Một tập kinh nghiệm
Tập dữ liệu đầu vào của học có giám sát có gán nhãn trong khi tập dữ liệu đầu vào của học không có giám sát sẽ không được gán nhãn
Tác nhân và môi trường
Hồi quy tuyến tính
Là độ lệch trung bình giữa kết quả dự báo và giá trị quan sát trên tập dữ liệu huấn luyện
Vì hàm logit cho kết quả xấp xỉ tốt hơn hàm tuyến tính cho loại dữ liệu phân lớp
K-NN dùng để nhận dạng, phân loại mẫu dựa trên đặc điểm của K mẫu giống mẫu đang xét nhất
Xác định nhiễu trong một tập dữ liệu
Mô tả sự giống nhau giữa hai quan sát trong dữ liệu
Sử dụng dữ liệu và các quy luật làm dữ liệu đầu vào để phát triển thuật toán cho ra câu trả lời.
Dựa trên các dự liệu thuật toán học máy có dán nhãn. Càng nhiều dữ liệu, thuật toán càng chính xác khi phân loại dữ liệu mới
Đánh giá mô hình bằng dữ liệu thẩm định
Bài toán nhận dạng
Q-learning
Hồi quy tuyến tính dùng trong dự báo, hồi quy logistic dùng trong phân lớp
PCA
Được sử dụng trong cả bài toán hồi quy và bài toán phân lớp
Thuật toán học có giám sát
Information Gain
Gini index
1, 2 và 3
C1: (4,4), C2: (2,2), C3: (7,7)
10
Học theo cây quyết định
Nút gốc, nút nội bộ( mang tên thuộc tính của CSDL), và nút lá( mang giá trị có thể của thuộc tính)
Giá trị dự đoán của biến mục tiêu cho trước các giá trị của các biến được biểu diễn bởi đường đi từ gốc tới nút lá đó
Duyệt từ nút gốc của cây cho đến khi đụng đến nút lá, từ đó rút ra lớp của đối tượng cần xét
Phương pháp Elbow
Số cụm
Một ví dụ đầu vào, dự đoán đầu ra là kiểu rời rạc
Không cần phải học n bộ phân loại cho n lớp
Một ví dụ đầu vào, dự đoán đầu ra là kiểu số thực
Thuộc tính có giá trị Information gain cao nhất
Trong phương pháp KNN, đối với bài toán phân lớp có 2 lớp, k thường được chọn là:
Cả 2 phương án trên
Bài toán phân lớp và bài toán dự đoán/ hồi quy
Một hàm tính khoảng cách hình học
Tối thiểu hóa hàm đánh giá lỗi của hệ thống trong giai đoạn huấn luyện
Mức độ giảm về độ hỗn tạp Entropy của một tập
Một tập các số thực
Bài toán phân lớp văn bản
Phương pháp học không giám sát
Tối thiểu một trong ba điều kiện trên thỏa mãn
SVM là một phương pháp phân lớp tuyến tính dùng để phân tách 2 lớp của dữ liệu
Mặt siêu phẳng có lề cực đại
KHÔNG
Tập dữ liệu không có nhãn
Vô số
k cụm
Phương thức trong trí tuệ nhân tạo để dạy máy tính xử lý dữ liệu theo cách lấy cảm hứng từ bộ não con người
Vì nó giúp tự động hóa các tác vụ đòi hỏi trí tuệ con người
Phân tích dữ liệu và đưa ra dự đoán trong nhiều ứng dụng khác nhau
Xử lý hình ảnh
Recurrent Neural Networks (RNNs)
Xử lý ngôn ngữ tự nhiên hiệu quả hơn
Tạo ra dữ liệu mới như hình ảnh và âm thanh
Xác định các vật thể, khuôn mặt, cảnh vật trong hình ảnh
Chuyển đổi âm thanh thành văn bản
Đề xuất sản phẩm hoặc nội dung dựa trên sở thích người dùng
Phát hiện bệnh trong hình ảnh y tế
Học máy không thể xử lí các bài toán phức tạp
Là cấu trúc giả lập cách thức hoạt động của neuron trong não bộ con người
Một neuron có thể có nhiều input và có nhiều output
3
Chỉ có thể làm việc với một input và một output
Học sâu
AI chứa ML và ML chứa DL
Học sâu
4
1
1
Các đặc trưng của dữ liệu cần được định nghĩa trong học máy, trong khi học sâu có thể tự xác định các đặc trưng của dữ liệu
Học sâu là một bộ phận của học máy dùng nhiều mạng neuron để mô phỏng khả năng suy diễn và ra quyết định của con người
Học sâu là lớp con của trí tuệ nhân tạo
Học máy là một lớp con của học sâu
Trích xuất các đặc trưng của dữ liệu
Giảm kích thước dữ liệu
Convolution Neural Network và Recurrent Neural Network
Học sâu
Đòi hỏi trích xuất đặc trưng một cách thủ công
Mô phỏng cấu trúc kết nối của não người
ReLU
Mạng nơ ron nhiều lớp ẩn
Giữa những năm 1980
H.P. Luhn
Dữ liệu số trong cơ sở dữ liệu quan hệ
Tiến bộ công nghệ
Business Intelligence (BI)
Giám sát các nguồn văn bản trực tuyến
Công cụ tìm kiếm dựa trên tri thức cho các văn bản y sinh học
Các mô hình phân tích dự đoán
Dự đoán các kết quả mong muốn
Tự động hóa việc phân tích dữ liệu
Truy xuất thông tin (Information Retrieval)
Khai thác dữ liệu (Data Mining)
Phát hiện các thông tin hữu ích hoặc xu hướng tiềm ẩn từ văn bản phi cấu trúc
Truy xuất dữ liệu (Data Retrieval)
Cơ sở dữ liệu có cấu trúc
Hướng đến mục tiêu
Tìm một nhà hàng phục vụ đồ ăn chay
Phi cấu trúc
Có cấu trúc
Theo cơ hội
Tìm xu hướng về số lượt ghé thăm một nhà hàng chay
Không có cấu trúc
Tìm các loại ngộ độc thực phẩm thường liên quan đến đồ ăn nhanh
Trí tuệ nhân tạo
Hiểu ý nghĩa của một câu, một đoạn văn
Tạo ra một bản tóm tắt ngắn gọn từ một văn bản dài
Dịch từ ngôn ngữ này sang ngôn ngữ khác
Chuyển đổi âm thanh thành văn bản
Nghiên cứu cách con người xác định từ
Phân tích câu
Nghiên cứu cách con người học một ngôn ngữ
Syntax (Cú pháp)
Phân giải nhập nhằng từ
Dựa trên tập ngữ liệu
Hỏi đáp
Pragmatic (Thực chứng)