Tạo nội dung địa phương trên quy mô lớn
Ngày 21/01/2026 - 10:01Sử dụng công nghệ tạo ngôn ngữ tự nhiên để tạo nội dung siêu địa phương.
Tôi gọi đây là việc sử dụng công nghệ tạo ngôn ngữ tự nhiên để tạo nội dung siêu địa phương. Tôi biết là có rất nhiều từ dài trong đó. Một số bạn quen thuộc với chúng, một số thì không.
Để tôi đưa ra một ví dụ, có lẽ bạn đã từng gặp phải tình huống này rồi. Hãy tưởng tượng bạn có một khách hàng mới và khách hàng đó có khoảng 18.000 địa điểm trên khắp nước Mỹ.
Sau đó, Google nói với bạn rằng bạn cần tạo nội dung độc đáo. Tất nhiên, không nhất thiết phải là 18.000 nội dung. Ngay cả 100 địa điểm cũng có thể khó khăn, không chỉ là việc tạo nội dung độc đáo mà còn là tạo nội dung có giá trị độc đáo và có liên quan đến địa điểm cụ thể đó.
Vậy nên hôm nay tôi muốn trình bày một phương pháp cụ thể sử dụng công nghệ tạo ngôn ngữ tự nhiên để tạo ra các trang web kiểu này với số lượng lớn.
Tạo ngôn ngữ tự nhiên là gì?
Giờ thì có một vài câu hỏi mà chúng ta cần giải đáp ngay từ đầu. Đầu tiên, tạo ngôn ngữ tự nhiên là gì? Thực ra, tạo ngôn ngữ tự nhiên ban đầu được tạo ra với mục đích tạo ra các cảnh báo thời tiết. Chắc hẳn bạn đã thấy điều này hàng trăm nghìn lần rồi.
Mỗi khi có giông bão hoặc cảnh báo gió lớn, bạn sẽ thấy thông báo ở cuối màn hình tivi (nếu bạn lớn tuổi như tôi) hoặc trên điện thoại di động rằng Cơ quan Dự báo Thời tiết Quốc gia đã đưa ra cảnh báo về một hiện tượng thời tiết nguy hiểm và bạn cần tìm nơi trú ẩn.
Thực ra, ngôn ngữ mà bạn thấy ở đó được tạo ra bởi máy móc. Nó xem xét tất cả dữ liệu mà họ đã thu thập được về thời tiết, rồi ghép chúng thành những câu mà con người có thể tự động hiểu. Nó giống như trò chơi điền từ Mad Libs, nhưng mang tính kỹ thuật hơn nhiều ở chỗ, thay vì gây cười hay ngớ ngẩn, những gì tạo ra lại thực sự là thông tin hữu ích.
Đó là mục tiêu của chúng tôi. Chúng tôi muốn sử dụng công nghệ tạo ngôn ngữ tự nhiên để tạo ra các trang web địa phương cho một doanh nghiệp có chứa thông tin rất hữu ích.
Đó chẳng phải là chiếc mũ đen sao?
Câu hỏi mà chúng tôi hầu như luôn nhận được, hoặc ít nhất là tôi hầu như luôn nhận được, là: Đây có phải là SEO mũ đen không? Một trong những điều chúng ta không nên làm là tự động tạo nội dung.
Vậy nên, tôi sẽ dành chút thời gian ở cuối bài để thảo luận chi tiết về cách chúng tôi phân biệt loại hình tạo nội dung này với kiểu tạo nội dung thông thường, kiểu "điền từ vào chỗ trống" (Mad Libs), và những gì chúng tôi đang làm ở đây. Những gì chúng tôi đang làm ở đây là cung cấp nội dung có giá trị độc đáo cho khách hàng, và chính vì điều đó, nó đáp ứng được tiêu chí là nội dung chất lượng.
Hãy xem một ví dụ.
Vậy chúng ta hãy bắt đầu thôi. Hãy cùng thảo luận về phương pháp mà tôi cho là dễ nhất, và tôi gọi đó là phương pháp Google Trends.
Chọn các mặt hàng để so sánh
Vậy hãy cùng nhìn lại một chút và nói về doanh nghiệp có 18.000 địa điểm này. Chúng ta biết gì về doanh nghiệp này? Chà, các doanh nghiệp đều có một vài điểm chung bất kể ngành nghề nào.
Họ có thể có những sản phẩm hoặc dịch vụ tương tự nhau, và những sản phẩm và dịch vụ đó có thể có kiểu dáng, hương vị hoặc các loại topping khác nhau, nói chung là đủ loại thứ mà bạn có thể so sánh giữa các mặt hàng và dịch vụ khác nhau mà họ cung cấp. Đó chính là cơ hội của chúng ta để tạo ra nội dung độc đáo trên hầu hết mọi khu vực ở Hoa Kỳ.
Công cụ chúng ta sẽ sử dụng để thực hiện điều đó là Google Trends. Vì vậy, bước đầu tiên bạn cần làm là lấy một khách hàng, ví dụ như một chuỗi cửa hàng pizza, và chúng ta sẽ xác định những mặt hàng mà chúng ta muốn so sánh. Trong trường hợp này, tôi có thể chọn các loại topping chẳng hạn.
Vậy nên chúng ta sẽ quan tâm đến xúc xích pepperoni, xúc xích thường, cá cơm và cả dứa nữa, đủ loại topping khác nhau tùy theo vùng miền, thành phố và địa điểm. Vì vậy, chúng ta sẽ trực tiếp sử dụng Google Trends.
Điểm tuyệt vời nhất của Google Trends là nó không chỉ cung cấp thông tin ở cấp quốc gia. Bạn có thể thu hẹp phạm vi tìm kiếm xuống cấp thành phố, cấp tiểu bang, hoặc thậm chí trong một số trường hợp là cấp mã bưu chính, và nhờ đó, chúng ta có thể thu thập thông tin siêu địa phương về một loại dịch vụ hoặc sản phẩm cụ thể.
Ví dụ, đây thực chất là sự so sánh nhu cầu về các loại topping pizza như pepperoni, nấm và xúc xích ở Seattle hiện nay. Hầu hết mọi người khi tìm kiếm pizza trên Google đều sẽ tìm kiếm pepperoni.
Thu thập dữ liệu theo địa điểm
Vậy nên điều bạn cần làm là thu thập thông tin từ tất cả các địa điểm khác nhau. Ví dụ, bạn sẽ biết rằng ở đây, nhu cầu về pizza pepperoni có lẽ gấp khoảng 2,5 lần so với pizza xúc xích. Tuy nhiên, điều này không nhất thiết đúng ở mọi thành phố và mọi tiểu bang. Trên thực tế, nếu bạn chọn nhiều loại topping khác nhau, bạn sẽ tìm thấy đủ loại thông tin, không chỉ là sự so sánh về số lượng người đặt hàng hoặc mong muốn sử dụng chúng, mà còn cả sự thay đổi theo thời gian.
Ví dụ, có lẽ xúc xích pepperoni đã trở nên ít phổ biến hơn. Nếu bạn để ý ở một số thành phố nhất định, điều đó có lẽ đúng vì xu hướng ăn chay và thuần chay ngày càng tăng. Điều tuyệt vời của việc tạo ngôn ngữ tự nhiên là chúng ta có thể tự động trích xuất những mối quan hệ độc đáo đó và sau đó sử dụng chúng làm dữ liệu để định hình nội dung mà chúng ta đưa lên các trang trên trang web của mình.
Ví dụ, giả sử chúng ta lấy Seattle làm ví dụ. Hệ thống sẽ tự động nhận diện được các loại mối quan hệ khác nhau này. Giả sử chúng ta biết rằng xúc xích pepperoni là loại phổ biến nhất. Hệ thống cũng có thể nhận diện được rằng, ví dụ, cá cơm đã lỗi thời trên pizza. Hầu như không ai muốn ăn chúng nữa.
Đại loại là như vậy. Nhưng điều đang xảy ra là chúng ta đang dần dần tìm ra những xu hướng và dữ liệu thú vị và hữu ích cho những người sắp đặt pizza. Ví dụ, nếu bạn tổ chức một bữa tiệc cho 50 người và bạn không biết họ muốn gì, bạn có thể làm theo cách mà hầu hết mọi người vẫn làm, đó là khoảng một phần ba pepperoni, một phần ba thường và một phần ba rau củ, đây là kiểu phổ biến nếu bạn tổ chức tiệc sinh nhật hoặc gì đó tương tự.
Nhưng nếu bạn vào trang của Pizza Hut hoặc Domino's và thấy rằng ở thành phố bạn sống, người ta thực sự rất thích loại topping này, thì bạn có thể đưa ra quyết định tốt hơn về món mình sẽ gọi. Vì vậy, chúng tôi thực sự đang cung cấp thông tin hữu ích.
Tạo văn bản
Vậy đây là phần chúng ta bàn về việc tạo ra văn bản dựa trên các xu hướng và dữ liệu mà chúng ta đã thu thập được từ tất cả các khu vực.
- Tìm hiểu xu hướng địa phương
Bước đầu tiên, tất nhiên, là xem xét các xu hướng địa phương. Nhưng xu hướng địa phương không phải là nơi duy nhất chúng ta có thể xem xét. Chúng ta có thể đi xa hơn thế. Ví dụ, chúng ta có thể so sánh nó với các địa điểm khác. Vì vậy, có thể sẽ rất thú vị khi biết rằng ở Seattle, người ta rất thích nấm làm topping hoặc những thứ tương tự.
- So sánh với các địa điểm khác
Nhưng sẽ rất thú vị nếu xem xét liệu các loại topping được ưa chuộng, ví dụ, ở Chicago, nơi pizza kiểu Chicago thống trị, so với New York có khác nhau hay không. Đó sẽ là một điều thú vị và có thể được tự động tìm ra bằng cách sử dụng ngôn ngữ tự nhiên. Cuối cùng, một điều nữa mà mọi người thường bỏ qua khi cố gắng triển khai giải pháp này là họ nghĩ rằng họ phải so sánh mọi thứ cùng một lúc.
- Chọn một tập hợp con các mục
Đó không phải là cách bạn nên làm. Điều bạn nên làm là chọn ra những thông tin thú vị nhất trong mỗi trường hợp. Bây giờ chúng ta có thể đi sâu vào khía cạnh kỹ thuật về cách thực hiện điều đó. Ví dụ, chúng ta có thể nói, được rồi, chúng ta có thể xem xét các xu hướng. Nếu tất cả các xu hướng đều đi ngang, thì có lẽ chúng ta sẽ không chọn thông tin đó. Nhưng nếu chúng ta thấy rằng mối quan hệ giữa một loại topping này và một loại topping khác ở thành phố này lại khác biệt rõ rệt so với các thành phố khác, thì đó có thể là thông tin được chọn.
Đánh giá của con người
Giờ đây, câu hỏi đặt ra là về SEO mũ trắng so với SEO mũ đen. Chúng ta có một trang web địa phương, và giờ chúng ta đã tạo ra tất cả nội dung văn bản về những gì mọi người muốn trên một chiếc pizza ở thị trấn hoặc thành phố cụ thể đó. Chúng ta cần đảm bảo rằng nội dung này thực sự chất lượng. Đó là bước cuối cùng, chính là xem xét thủ công.
Theo tôi, nội dung được tạo tự động, miễn là nó hữu ích và có giá trị, và đã được biên tập viên con người xác nhận là đúng, thì cũng tốt không kém gì việc biên tập viên đó tự tra cứu dữ liệu và viết cùng một câu.
Vì vậy, tôi nghĩ trong trường hợp này, đặc biệt là khi chúng ta đang nói về việc cung cấp dữ liệu cho nhiều địa điểm khác nhau trên khắp đất nước, thì việc tận dụng công nghệ theo cách cho phép chúng ta tạo ra nội dung và đồng thời cung cấp cho người dùng nội dung tốt nhất và phù hợp nhất có thể là điều hợp lý.
