[NHẠC] Vâng hãy nhìn vào thuật toán phân nhóm sử dụng ma trận này chỉ dựa vào khoảng cách đến nhóm trung tâm. Ok ở đây chúng ta thấy dữ liệu mà chúng ta sẽ muốn nhóm lại. Và thuật toán này, được gọi là thuật toán k-means, bắt đầu bằng việc giả sử rằng bạn sẽ kết thúc với k nhóm. Bạn chỉ ra số các nhóm trước khi bắt đầu. Lý do thuật toán được gọi là k-means là chúng ta có k nhóm và chúng ta xét về ý nghĩa của các nhóm, chỉ các nhóm trung tâm, khi chúng ta gán các điểm cho các nhóm khác nhau. Ok, hãy nói về cách chúng ta khởi tạo thuật toán. Việc đầu tiên chúng ta làm là chúng ta lấy một ví dụ. Có rất nhiều cách để khởi tạo cho việc đặt các nhóm trung tâm. Chúng ta sẽ nói sâu hơn về những điều này sau. Nhưng bây giờ hãy giả sử rằng chúng ta lấy ngẫu nhiên ba nhóm trung tâm khác nhau. Nếu chúng ta sẽ giả sử thuật toán 3-means ở đây. Và sau đó bước đầu tiên là chúng ta sẽ gán mọi sự quan sát tới nhóm trung tâm gần nhất. Sự quan sát ở đây được gán với nhóm đỏ. Những sự quan sát này gần với nhóm màu xanh lá hoặc nhóm trung tâm xanh lá ở đây. Và những cái này gần nhất với trung tâm xanh nước biển. Một cách để làm điều này được gọi là Voronoi tessellation. Chúng ta hãy nhìn vào các nhóm trung tâm và chúng ta có thể xác định, để tôi chuyển lại sang màu đỏ tươi này. Đây là các nhóm trung tâm. Và chúng ta chỉ có thể xác định những vùng này. Và các vùng này đại diện cho nhóm mà các quan sát có thể thuộc vào. bất kì sự quan sát mới nào cũng là một màu rất xấu trên màu đỏ. Tôi có màu nào khác không? Trắng thì sao? Màu lạnh, trắng. Một số quan sát mới tôi có ở đây, nếu nó nằm trong vùng màu đỏ này, tôi biết nó gần nhất với nhóm trung tâm màu đỏ này. Đó là những gì mà các vùng được tô màu đại diện. Ok đây là bước đầu tiên của thuật toán. Những gì tôi kết thúc ở đây là các quan sát mà được gán với các nhóm. Nhưng tôi chỉ tạo ngẫu nhiên các nhóm trung tâm, vì thế có thể tôi không tin rằng điều đó thực sự đại diện cho cấu trúc của dữ liệu. Cái mà tôi muốn làm là tôi muốn lặp lại quá trình này, nơi mà tôi muốn cập nhật định nghĩa của tôi là nhóm trung tâm dựa trên sự quan sát mà tôi đã chỉ ra. Nếu bạn nhớ nhóm đỏ này, nó chỉ có một sự quan sát gán với nó. Vì thế khi tôi sửa nhóm trung tâm cho nhóm đó, nó chỉ di chuyển đến sự quan sát trước. Nhưng với nhóm màu xanh lá này, nếu tôi nhìn vào nhóm trung tâm trước ở đây, tôi sẽ di chuyển nó tới trung tâm của tất cả sự quan sát mà được gán với nhóm màu xanh lá. Và trung tâm của tất cả chúng là ở đây, cái này trở thành nhóm trung tâm mới. Và như vậy tôi làm điều này với tất cả sự quan sát màu xanh dương. Đây là nhóm trung tâm mới cho sự quan sát màu xanh dương này. Ok bây giờ tôi có một tập hợp nhóm trung tâm mới. Và cái tôi có thể làm là vẽ Voronoi tessellation và đưa các quan sát của tôi tới nhóm trung tâm gần nhất. Sau đó tôi lặp lại quá trình này cho tới khi đồng quy. [NHẠC]