DANH MỤC DỊCH VỤ

ChatGPT sẽ không thay thế Google Search (ít nhất là hiện tại).

Ngày 28/12/2025 - 03:12

Ngay cả trong những tin tức và thông tin ồn ào không ngừng nghỉ của đầu năm 2023, có lẽ bạn cũng đã nghe nói về ChatGPT, chatbot được hỗ trợ bởi GPT-3 (chính xác hơn là 3.5) có khả năng mô phỏng các phản hồi giống con người một cách đáng kinh ngạc

Mục lục

Ví dụ, hãy xem câu hỏi và câu trả lời này (được tạo bởi GPT-3):

ChatGPT có phải là một công cụ tìm kiếm không?
Không, ChatGPT không phải là công cụ tìm kiếm. Nó là một chatbot trí tuệ nhân tạo sử dụng xử lý ngôn ngữ tự nhiên để hiểu và phản hồi đầu vào của người dùng.

Không tệ chút nào, và nghe có vẻ như đó là điều mà một người bình thường sẽ viết.

GPT (Generative Pre-training Transformer) là một hệ thống học sâu tạo ra văn bản dựa trên việc dự đoán các mẫu ngôn ngữ sau khi được huấn luyện trước với một tập hợp lớn các tài liệu. Trong bài viết này, tôi sẽ sử dụng Playground của OpenAI với mô hình GPT-3 “text-davinci-003”, có thể được lập trình để tạo ra các câu trả lời ngắn hơn và đáng tin cậy hơn so với ChatGPT Beta.

Các mô hình hiện tại thực sự rất ấn tượng, bao gồm cả khả năng phân tích các câu hỏi phức tạp:

Bạn sẽ giải thích ChatGPT cho một đứa trẻ 5 tuổi như thế nào?
ChatGPT giống như một người bạn robot có thể trò chuyện và trả lời các câu hỏi của bạn. Nó giống như một người bạn biết rất nhiều về nhiều lĩnh vực khác nhau và có thể giúp bạn học hỏi những điều mới.

GPT thậm chí có thể bắt chước sự sáng tạo của con người và khiến chúng ta bắt đầu nghi ngờ về tài năng của chính mình:

Hãy viết một khẩu hiệu cho nhà hàng theo chủ đề sao Hỏa do người thằn lằn điều hành, theo phong cách của Edgar Allan Poe.
"Những con thằn lằn sao Hỏa, hãy dùng bữa tại đây trong sự xa hoa, nơi những giấc mơ được bung nở và vị giác được thỏa mãn!"

Đến giờ, chắc hẳn bạn đã thấy hàng tá ví dụ rồi, vậy tất cả những điều này liên quan gì đến Google Search và công việc của chúng ta với tư cách là những người làm tiếp thị tìm kiếm?

Google và kỷ nguyên ngôn ngữ tự nhiên

Vào những ngày đầu của công cụ tìm kiếm, các công cụ tìm kiếm được xây dựng để lập chỉ mục các từ và cụm từ ngắn và không có khả năng xử lý ngôn ngữ tự nhiên. Nếu bạn đang tìm kiếm một chiếc máy tính xách tay mới, bạn có thể tìm kiếm những từ như “máy tính xách tay” hoặc “mua máy tính xách tay”. Tôi đôi khi nói đùa rằng, nếu bạn bước vào Best Buy và bắt đầu hét lên “máy tính xách tay!”, bạn có thể sẽ bị nhân viên an ninh đưa ra ngoài. Tuy nhiên, con người chúng ta đã thích nghi với công cụ tìm kiếm thời kỳ đầu và chúng ta đã đơn giản hóa ngôn ngữ của mình.

Khi công cụ tìm kiếm trở nên tinh vi hơn, chúng ta nhận ra rằng mình có thể sử dụng các truy vấn phức tạp hơn, và đặc biệt là với sự ra đời của tìm kiếm bằng giọng nói, chúng ta đã thử nghiệm với những thứ gần gũi hơn với ngôn ngữ tự nhiên. Khi Google thích nghi, một điều thú vị đã xảy ra: các truy vấn của chúng ta trở thành câu hỏi, khiến Google nhận ra rằng đôi khi chúng ta không muốn một liên kết đến tài nguyên — mà chúng ta muốn một câu trả lời.

Google đã phát triển rất nhiều với vai trò là một "công cụ tìm kiếm câu trả lời", bao gồm việc xây dựng Biểu đồ Tri thức (Knowledge Graph) và hiển thị kết quả tìm kiếm dưới dạng câu trả lời trực tiếp, được gọi là Đoạn trích nổi bật (Featured Snippets). Ví dụ, nếu bạn tìm kiếm "Google search hoạt động như thế nào?", bạn có thể nhận được một Đoạn trích nổi bật (về cơ bản là một câu trả lời được gán cho từ khóa)

Ví dụ cụ thể này hơi vụng về, nhưng nó minh họa cách thuật toán hoạt động. Google đang tìm kiếm những mẩu thông tin nhỏ trong tài liệu có thể trả lời câu hỏi. Trong trường hợp này, rõ ràng đoạn văn được trích xuất không thực sự là một câu trả lời hoàn chỉnh.

Bây giờ, hãy xem xét câu hỏi tương tự được đặt ra cho GPT-3:

Tìm kiếm trên Google hoạt động như thế nào?
Google Search hoạt động bằng cách thu thập thông tin từ web và lập chỉ mục các trang web. Khi người dùng tìm kiếm thứ gì đó, Google sẽ xem xét chỉ mục của mình và trả về các kết quả phù hợp nhất. Nó sử dụng sự kết hợp của các thuật toán và các kỹ thuật khác để xác định mức độ liên quan của kết quả. Các thuật toán này xem xét các yếu tố như từ khóa được sử dụng trong truy vấn, tính cập nhật của nội dung, mức độ phổ biến của trang web và vị trí của người dùng.

Tôi có thể soi mói câu trả lời này một chút, nhưng nhìn chung, nó khá tốt và là một câu trả lời đầy đủ hơn nhiều so với một đoạn trích từ một trang web. Công cụ GPT-3 về cơ bản đã tóm tắt nhiều nguồn khác nhau.

Thật dễ hiểu vì sao điều này có thể bắt đầu khiến Google lo lắng.

Lòng tin và vấn đề quy kết

Thoạt nhìn, GPT-3 (và đặc biệt là ChatGPT) có thể đưa ra những phản hồi khá giống con người. Bỏ qua các vấn đề đạo đức (bao gồm đạo văn và thiên vị, mà tôi sẽ đề cập ngắn gọn sau), vẫn còn một số vấn đề thực tiễn nghiêm trọng.

Câu trả lời của Google có một ưu điểm lớn: khả năng ghi nguồn. Chúng ta có thể dễ dàng truy cập trang nguồn. Điều này không chỉ cung cấp cho chúng ta nhiều thông tin hơn, mà còn cung cấp thêm ngữ cảnh, bao gồm cả thông tin chi tiết về chính nguồn đó. Những chi tiết này có thể giúp chúng ta tin tưởng (hoặc, trong một số trường hợp, không tin tưởng) vào câu trả lời.

Ví dụ, hãy xem xét một câu trả lời khác mà GPT-3 đã đưa ra cho câu hỏi trên:

Tìm kiếm trên Google hoạt động như thế nào?
Google Search hoạt động bằng cách sử dụng sự kết hợp giữa các thuật toán và chương trình để phân tích nội dung của các trang web và các nội dung trực tuyến khác nhằm xác định mức độ liên quan của chúng với truy vấn tìm kiếm của người dùng. Các thuật toán tìm kiếm của Google xem xét nhiều yếu tố, bao gồm mật độ từ khóa , tính cập nhật và số lượng các trang web khác liên kết đến trang đó. Google cũng sử dụng trí tuệ nhân tạo và máy học để cải thiện kết quả tìm kiếm của mình.

Câu trả lời này nghe cũng có vẻ hợp lý, ngoại trừ việc hầu hết các chuyên gia SEO sẽ cảm thấy khó chịu khi nghe nhắc đến mật độ từ khóa (tôi đã gạch chân), vốn được coi là một điều hoang đường. Hoàn toàn có thể thông tin này đến từ một nguồn hoàn toàn khác, nhưng nếu không có ghi nguồn, chúng ta không thể xác thực được.

Mặc dù đây là một vấn đề phức tạp (văn bản do máy tạo ra không sử dụng nguồn theo cách giống như con người, hoặc có thể sử dụng hàng chục hoặc hàng trăm nguồn), nhưng các phương pháp kết hợp nhằm giảm số lượng nguồn và cung cấp thông tin ghi nguồn là hoàn toàn khả thi.

Mặc dù chức năng này vẫn đang trong giai đoạn thử nghiệm và rõ ràng là chưa hoạt động ở quy mô của Google, Neeva vẫn cố gắng cung cấp các nguồn thông tin chính. Tôi cố tình chọn một ví dụ ngớ ngẩn vì mức độ rủi ro không cao.

Đây là một câu hỏi có thể ảnh hưởng nghiêm trọng đến tương lai tài chính của tôi, và việc biết câu trả lời đến từ đâu sẽ tạo ra sự khác biệt lớn, cho phép tôi tìm hiểu sâu hơn và hoặc thiết lập lòng tin hoặc bác bỏ những nguồn tin đó.

Liên quan đến vấn đề lòng tin là một vấn đề đạo đức sâu sắc hơn, đó là liệu văn bản do máy tạo ra có phải là một hình thức đạo văn hay không. Trong khi đạo văn truyền thống thường đòi hỏi sự cố ý và sao chép những đoạn văn bản dài, thì văn bản do máy tạo ra vẫn được xây dựng dựa trên công sức của các tác giả và người tạo nội dung, mà không có – ít nhất là trong trường hợp của ChatGPT – bất kỳ sự ghi nhận rõ ràng nào. Trong trường hợp của Google, việc lạm dụng văn bản do máy tạo ra có thể làm nản lòng những người tạo nội dung và khiến chúng ta đặt câu hỏi liệu chúng ta có muốn đóng góp công sức của mình cho cỗ máy của người khác hay không.

Ảo giác và giấc mơ máy móc

Nếu không có những ràng buộc cẩn thận, các hệ thống học máy dễ bị ảo giác. Trong trường hợp của ChatGPT, điều đó về cơ bản có nghĩa là hệ thống có thể tạo ra các câu trả lời không dựa trên thực tế. Nói một cách đơn giản, ChatGPT không hiểu bất cứ điều gì nó đang nói — nó đang tạo ra các mô hình mới dựa trên ngôn ngữ của con người. Hãy xem xét câu hỏi vô nghĩa này mà tôi đã đặt cho GPT-3:

Bài hát nổi tiếng "The Fast and the Furious: Tokyo Drift" năm 1976 của Mozart nói về điều gì?
Bản nhạc nổi tiếng năm 1976 của Mozart, "The Fast and the Furious: Tokyo Drift", không liên quan đến bộ phim cùng tên năm 2006. Đây là một bản nhạc không lời, ghi lại năng lượng cuồng nhiệt của đường phố Tokyo về đêm. Bài hát được xây dựng dựa trên một giai điệu piano bắt tai, phức tạp và một nhịp điệu mạnh mẽ, sôi động.

Tuy nghe có vẻ thú vị, nhưng không hề có bản nhạc không lời nào như vậy. Tôi đã hỏi một câu hỏi vô nghĩa và GPT-3 đã đáp lại tôi bằng một câu trả lời vô nghĩa (Vô nghĩa vào, vô nghĩa ra).

Tôi cần lưu ý rằng ChatGPT đã có sẵn một số ràng buộc để giải quyết các vấn đề như thế này, và các mô hình phức tạp (bao gồm cả giao diện GPT-3 của OpenAI) cho phép bạn kiểm soát "tính ngẫu nhiên" (tính ngẫu nhiên cao = ít ràng buộc hơn), nhưng vấn đề cốt lõi vẫn rất khó giải quyết.

Hãy xem xét lại một câu hỏi tài chính có rủi ro cao hơn:

Loại tiền điện tử nào phổ biến hơn: Dogecoin, Bassetcoin hay Norwegianlundehundcoin?
Dogecoin là đồng tiền điện tử phổ biến nhất trong ba loại, với vốn hóa thị trường hiện tại hơn 9 tỷ đô la. Bassetcoin và Norwegianlundehundcoin là những đồng tiền nhỏ hơn nhiều, với vốn hóa thị trường chỉ vài trăm nghìn đô la mỗi loại.

Vốn hóa thị trường vài trăm nghìn đô la mỗi loại là khá ấn tượng đối với hai loại tiền điện tử mà (tính đến thời điểm viết bài này) chưa hề tồn tại. Tôi rất tiếc phải nói rằng tôi đã bắt đầu ví dụ này với Labradoodlecoin, chỉ để rồi phát hiện ra rằng Labradoodlecoin thực sự tồn tại.

Tôi đang cố gắng tận dụng tối đa khả năng của công cụ này để chứng minh luận điểm, và văn bản được tạo ra bằng máy móc hiện đại ít gây ảo giác hơn so với các phiên bản trước đây. Tuy nhiên, bất cứ khi nào bạn kết hợp nhiều nguồn thông tin mà không quan tâm đến tính xác thực hoặc đầy đủ của chúng, đều có nguy cơ thực sự là kết quả cuối cùng sẽ là một thứ vô nghĩa nghe có vẻ hợp lý.

Quy mô và internet thời gian thực

Điều này khá đơn giản: Những gì hiệu quả ở quy mô thử nghiệm (beta) có thể không hiệu quả ở quy mô của Google. Như cố chuyên gia Bill Slawski từng chỉ ra, chỉ vì Google có một ý tưởng — hoặc thậm chí đăng ký bằng sáng chế cho một ý tưởng — không có nghĩa là họ sẽ triển khai ý tưởng đó trong tìm kiếm (vì nhiều lý do).

Một vấn đề khác là tốc độ cực nhanh của internet. ChatGPT được huấn luyện trên một tập dữ liệu tĩnh — chỉ phản ánh thông tin tại một thời điểm nhất định. Google thu thập và lập chỉ mục internet rất nhanh, có thể trả về thông tin cập nhật, cục bộ và thậm chí được cá nhân hóa.

Điều đáng chú ý là Google đã đầu tư một khoản tiền khổng lồ vào học máy. Mô hình LaMDA (Language Model for Dialogue Applications) của Google có khả năng tạo ra văn bản phức tạp, giống như con người . Google nhận thức rõ những hạn chế và chi phí của các mô hình này. Nếu họ triển khai chúng một cách chậm rãi trên toàn bộ công cụ tìm kiếm, có lẽ là vì những lý do chính đáng.

Mặc dù chủ đề về thiên kiến vượt xa phạm vi bài viết này, quy mô cũng góp phần gây ra các vấn đề về thiên kiến. Khi bạn chuyển từ một tập dữ liệu tĩnh, được kiểm soát sang mở rộng các mô hình học máy cho toàn bộ thế giới nội dung thời gian thực, thiên kiến của con người sẽ nhanh chóng xuất hiện (bao gồm phân biệt chủng tộc, phân biệt giới tính, kỳ thị đồng tính và các thiên kiến tiêu cực khác). Ở quy mô của Google, việc giảm thiểu thiên kiến là một vấn đề đòi hỏi rất nhiều sự can thiệp của con người và nguồn lực.

Báo động đỏ và các mối đe dọa trong tương lai

Điều này không có nghĩa là Google không coi trọng GPT (bao gồm cả ChatGPT). Theo báo cáo, Google đã ban hành "báo động đỏ" sau khi ChatGPT lan truyền rộng rãi. Mặc dù Google giữ im lặng về phản ứng nội bộ của họ, nhưng gần như chắc chắn rằng những diễn biến gần đây đang thúc đẩy các cuộc thảo luận và phát triển tại Mountain View.

Một mối đe dọa rõ ràng khác là Microsoft đang đầu tư (với số tiền lên tới 1 tỷ đô la) vào OpenAI (và cùng với đó là ChatGPT), và có tin đồn rằng họ có thể đầu tư thêm hàng tỷ đô la nữa . Microsoft cũng đã thông báo rằng họ sẽ bắt đầu tích hợp ChatGPT vào tìm kiếm Bing trước cuối tháng 3, mặc dù chưa rõ quá trình triển khai ban đầu sẽ mất bao lâu.

Một trong những tác động dài hạn lớn nhất của các mô hình như ChatGPT và LaMDA sẽ nằm ở tìm kiếm hội thoại (bao gồm, nhưng không giới hạn ở, tìm kiếm bằng giọng nói). Hãy xem xét "cuộc hội thoại" sau đây mà tôi đã có với ChatGPT (đã được chỉnh sửa cho ngắn gọn):

Năm mẫu SUV ba hàng ghế hàng đầu là những mẫu xe nào?
Thật khó để nói đâu là năm mẫu SUV ba hàng ghế tốt nhất vì điều này mang tính chủ quan và phụ thuộc vào các yếu tố như sở thích cá nhân, ngân sách và địa điểm. Tuy nhiên, một số mẫu SUV ba hàng ghế thường được coi là những chiếc xe tốt nhất trong phân khúc của chúng bao gồm:
Honda Pilot
Toyota Highlander
Kia Telluride
Hyundai Palisade
Subaru Ascent
Trong số đó, cái nào có giá rẻ nhất?
Trong số năm mẫu SUV mà tôi đã đề cập, Subaru Ascent có giá thấp nhất với giá khởi điểm khoảng 32.295 đô la. Các mẫu SUV khác có giá khởi điểm khoảng 32.000 - 38.000 đô la. Tuy nhiên, điều quan trọng cần lưu ý là giá cuối cùng có thể thay đổi tùy thuộc vào phiên bản cụ thể và các tùy chọn được chọn.
Nhìn chung, xe Subaru có được đánh giá là đáng tin cậy không?
Subaru thường được coi là một nhà sản xuất ô tô đáng tin cậy, với nhiều mẫu xe của hãng nhận được điểm cao về độ bền. Đặc biệt, Subaru Ascent nổi tiếng là một chiếc xe đáng tin cậy với nội thất thoải mái và khả năng tiết kiệm nhiên liệu tốt. Theo Consumer Reports, Ascent đạt điểm độ tin cậy trên mức trung bình.

Xin lỗi, ChatGPT có thể hơi "nhiều lời" (và đây là phiên bản đã chỉnh sửa). Hãy lưu ý các câu hỏi tiếp theo và cách tôi không cần phải lặp lại thông tin hoặc cung cấp ngữ cảnh. ChatGPT hiểu rằng tôi muốn bổ sung thêm thông tin từ các câu trả lời trước đó.

Mặc dù mô hình này không đáp ứng được tất cả các trường hợp sử dụng tìm kiếm, nhưng chắc chắn có những tình huống mà khả năng dễ dàng và tự động tinh chỉnh truy vấn có thể mang tính cách mạng, đặc biệt là đối với các câu hỏi phức tạp, và, đúng vậy, các giao dịch mua bán phức tạp. Hãy tưởng tượng Google có thể hiển thị các quảng cáo khác nhau ở mỗi bước trong hành trình hướng tới việc mua hàng.

Thật không may, mối đe dọa lớn nhất trong ngắn hạn đối với Google là việc mọi người và các công ty có thể sẽ sử dụng ChatGPT để tạo ra hàng loạt nội dung chất lượng thấp, gây tốn thời gian và tiền bạc cho Google và có khả năng dẫn đến các bản cập nhật thuật toán lớn mang tính phản ứng. Điều này cũng sẽ gây ra rắc rối nghiêm trọng cho các nhà tiếp thị tìm kiếm, những người sẽ phải phản ứng lại những bản cập nhật đó.

Điều chắc chắn trong năm 2023 là sự phổ biến của ChatGPT và khả năng tiếp cận dễ dàng với công chúng sẽ dẫn đến sự bùng nổ đầu tư (dù tốt hay xấu) và thúc đẩy sự phát triển. Mặc dù Google sẽ không biến mất, chúng ta có thể dự đoán rằng bối cảnh tìm kiếm sẽ thay đổi theo những cách không ngờ (và đôi khi không mong muốn) trong năm tới.

Bình luận

Dịch vụ liên quan

Nội dung bài viết