Bản chất của mô hình chủ đề là tô màu cho văn bản và từ

Khái niệm:: Văn bản
Cho rất nhiều văn bản, mỗi văn bản chứa rất nhiều từ. Mục tiêu là tô màu các từ sao cho:

  1. Mỗi văn bản càng chứa ít màu càng tốt
  2. Mỗi từ phải dùng càng ít màu để tô càng tốt

Thuật toán Gibbs sẽ chạy như sau: Với mỗi từ chưa được tô màu sẽ thống kê các màu đã được tô trước, sau đó chọn màu cho từ đó theo xác suất. Như vậy màu nào thoả điều kiện thì sẽ có xác suất to hơn, nhưng vẫn không loại trừ những cái nhỏ hơn

1

Nguồn::