Mục lục

Dùng ChatGPT viết Content SEO: Những điều bạn nên biết

Dùng ChatGPT viết Content SEO là ý tưởng được đưa ra và thử nghiệm rất nhiều bởi các cao thủ SEO từ khi Công nghệ này cho ra mắt vào tháng 11/2022. Tuy nhiên, việc nó hiện đang nhận được nhiều ý kiến trái chiều về hiệu quả cũng như khả năng bị Google phạt.

Vì vậy, bài viết này sẽ đưa ra một vài điều bạn cần biết trước khi quyết định có nên sử dụng ChatGPT viết Content SEO cho website của mình hay không.

XEM THÊM: ChatGPT là gì? Có thể ứng dụng ChatGPT để làm gì?

Tại sao ChatGPT có thể thực hiện những tác vụ của mình?

Hiểu một cách đơn giản, ChatGPT là một loại machine learning (máy học) được gọi là Large Learning Model (Mô hình học tập lớn).

Large Learning Model là trí tuệ nhân tạo được đào tạo trên lượng dữ liệu khổng lồ có thể dự đoán từ tiếp theo trong câu là gì. Được đào tạo với càng nhiều dữ liệu, ChatGPT sẽ làm được càng nhiều loại công việc khác nhau. Đôi khi các mô hình Large Learning phát triển những khả năng không ngờ đến.

Đại học Stanford cũng có bài viết về cách việc tăng dữ liệu đào tạo đã cho phép GPT-3 dịch văn bản từ tiếng Anh sang tiếng Pháp, mặc dù nó không được đào tạo cụ thể để thực hiện nhiệm vụ đó.

Các mô hình ngôn ngữ lớn như GPT-3 (và GPT-3.5 làm nền tảng cho ChatGPT) không được đào tạo để thực hiện các tác vụ cụ thể. Chúng được đào tạo với nhiều kiến ​​thức mà sau đó họ có thể áp dụng cho các lĩnh vực khác.

Điều này tương tự như cách một con người học hỏi. Ví dụ: nếu một người học các nguyên tắc cơ bản về nghề mộc, họ có thể áp dụng kiến ​​thức đó để đóng một cái bàn mặc dù người đó chưa bao giờ được dạy cụ thể cách làm việc đó.

GPT-3 hoạt động tương tự như bộ não con người ở chỗ nó chứa kiến ​​thức chung có thể áp dụng cho nhiều tác vụ.

Tại sao ChatGPT có thể thực hiện những tác vụ của mình

Bài báo của Đại học Stanford về GPT-3 giải thích:

“Không giống như các động cơ chess engines, giải quyết một vấn đề cụ thể, con người “nói chung” thông minh và có thể học cách làm bất cứ điều gì, từ viết thơ đến chơi bóng đá đến nộp tờ khai thuế.

Trái ngược với hầu hết các hệ thống AI hiện tại, GPT-3 đang tiến gần hơn đến trí thông minh chung như vậy…”

ChatGPT kết hợp một mô hình ngôn ngữ lớn khác có tên là InstructGPT, được đào tạo để nhận chỉ dẫn từ con người và câu trả lời dạng dài cho các câu hỏi phức tạp.

Khả năng làm theo hướng dẫn này giúp ChatGPT có thể nhận hướng dẫn để tạo một bài luận về hầu hết mọi chủ đề và thực hiện nó theo bất kỳ cách nào được chỉ định.

Nó có thể viết một bài luận trong các ràng buộc như đếm từ và bao gồm các điểm chủ đề cụ thể.

6 điều cần biết trước khi dùng ChatGPT viết Content SEO

ChatGPT có thể viết các bài luận về hầu hết mọi chủ đề vì nó được đào tạo trên nhiều loại văn bản dành cho công chúng.

Tuy nhiên, có những hạn chế đối mà bạn cần biết trước khi quyết định dùng ChatGPT viết Content SEO.

Hạn chế lớn nhất là ChatGPT không đáng tin cậy để tạo thông tin chính xác. Lý do nó không chính xác là vì mô hình chỉ dự đoán những từ nào sẽ xuất hiện sau từ trước đó trong một câu của một đoạn văn về một chủ đề nhất định. Nó không liên quan đến độ chính xác.

Đó phải là mối quan tâm hàng đầu đối với bất kỳ ai nghĩ đến việc tạo nội dung chất lượng.

6 điều cần biết trước khi dùng ChatGPT viết Content SEO

1. Được lập trình để tránh một số loại nội dung

Ví dụ: ChatGPT được lập trình cụ thể để không tạo văn bản về chủ đề bạo lực, tình dục khiêu dâm và nội dung có hại, chẳng hạn như hướng dẫn cách chế tạo thiết bị nổ.

2. Không biết các sự kiện đang xảy ra

Một hạn chế khác là nó không biết về bất kỳ nội dung nào được tạo sau năm 2021.

Vì vậy, nếu nội dung của bạn cần được cập nhật và mới thì ChatGPT ở dạng hiện tại có thể không hữu ích.

3. Có ​​tích hợp thành kiến chủ quan

Một hạn chế quan trọng cần lưu ý là ChatGPT được đào tạo để trở nên hữu ích, trung thực và vô hại. Đó không chỉ là lý tưởng, chúng là những thành kiến ​​có chủ ý được tích hợp sẵn trong máy. Có vẻ như ChatGPT đã được lập trình để trở nên vô hại, khiến cho đầu ra tránh các trả lời mang thiên hướng tiêu cực.

Đây là một điều tốt nhưng nó cũng thay đổi một cách tinh tế bất kỳ bài viết nào trở thành một bài viết mang tính trung lập. Nói một cách dễ hiểu, người ta phải cầm lái và yêu cầu ChatGPT lái xe theo hướng mong muốn một cách rõ ràng.

Dưới đây là một ví dụ về cách độ lệch thay đổi đầu ra.

Tôi đã yêu cầu ChatGPT viết một câu chuyện theo phong cách của Raymond Carver và một câu chuyện khác theo phong cách của nhà văn trinh thám Raymond Chandler. Cả hai câu chuyện đều có những kết thúc lạc quan không giống với đặc điểm của cả hai nhà văn.

Để có được đầu ra phù hợp với mong đợi của mình, tôi đã phải hướng dẫn ChatGPT với các hướng dẫn chi tiết để tránh kết thúc lạc quan và kết thúc kiểu Carver, tránh giải quyết câu chuyện. Vì đó là cách mà các câu chuyện của Raymond Carver thường diễn ra.

Vấn đề là ChatGPT có thành kiến ​​và người ta cần biết chúng có thể ảnh hưởng đến đầu ra như thế nào.

4. ChatGPT yêu cầu hướng dẫn rất chi tiết

ChatGPT yêu cầu hướng dẫn chi tiết để tạo ra nội dung có chất lượng cao hơn, có nhiều khả năng mang tính nguyên bản cao hoặc có quan điểm cụ thể. Càng nhiều hướng dẫn được đưa ra thì đầu ra sẽ càng tinh vi.

Đây vừa là điểm mạnh vừa là hạn chế cần lưu ý. Càng ít hướng dẫn trong yêu cầu nội dung thì càng có nhiều khả năng câu trả lời cho ra sẽ tương tự với yêu cầu khác.

Để thử nghiệm, tôi đã sao chép câu hỏi và kết quả mà nhiều người đã đăng trên Facebook. Khi tôi hỏi ChatGPT chính xác cùng một câu hỏi, máy đã tạo ra một bài luận hoàn toàn nguyên bản theo cấu trúc tương tự. Các câu trả lời sẽ có chung cấu trúc và các chủ đề phụ tương tự nhau, tuy nhiên sử dụng các từ ngữ khác nhau để biểu đạt.

ChatGPT được thiết kế để chọn các từ hoàn toàn ngẫu nhiên khi dự đoán từ tiếp theo trong một bài viết, vì vậy có nghĩa là bản thân nó không đạo văn.

Nhưng thực tế là các yêu cầu tương tự tạo ra các kết quả tương tự làm nổi bật những hạn chế của việc chỉ yêu cầu ChatGPT “hãy đưa cho tôi cái này. ”

5. Nội dung ChatGPT có thể được xác định không?

Các nhà nghiên cứu tại Google và các tổ chức khác đã nghiên cứu về các thuật toán trong nhiều năm để phát hiện thành công nội dung do AI tạo ra. Có nhiều tài liệu nghiên cứu về chủ đề này và tôi sẽ đề cập đến một tài liệu từ tháng 3 năm 2022 nghiên cứu kết quả đầu ra từ GPT-2 và GPT-3.

Bài báo nghiên cứu có tiêu đề, Adversarial Robustness of Neural-Statistical Features in Detection of Generative Transformers (PDF).

Các nhà nghiên cứu đã thử nghiệm để xem loại phân tích nào có thể phát hiện nội dung do AI tạo ra sử dụng các thuật toán được thiết kế để tránh bị phát hiện.

Họ đã thử nghiệm các chiến lược như sử dụng thuật toán BERT để thay thế các từ bằng từ đồng nghĩa, một chiến lược khác bổ sung lỗi chính tả, cùng các chiến lược khác.

Những gì họ phát hiện ra là một số tính năng thống kê của văn bản do AI tạo ra, chẳng hạn như chỉ số Gunning-Fog Index và Flesch Index, rất hữu ích để dự đoán liệu một văn bản có phải do máy tính tạo ra hay không, ngay cả khi văn bản đó đã sử dụng một thuật toán được thiết kế để tránh bị phát hiện.

6. Dấu Watermark vô hình

Điều đáng quan tâm hơn là các nhà nghiên cứu OpenAI đã phát triển watermark mật mã sẽ hỗ trợ phát hiện nội dung được tạo thông qua một sản phẩm OpenAI như ChatGPT.

Một bài báo gần đây đã kêu gọi sự chú ý đến một cuộc thảo luận của một nhà nghiên cứu OpenAI, có trong một video mang tiêu đề, Scott Aaronson nói về An toàn AI.

ChatGPT Watermarking

Nhà nghiên cứu tuyên bố rằng các hoạt động AI có đạo đức như tạo watermark có thể phát triển thành tiêu chuẩn ngành theo cách mà Robots.txt trở thành tiêu chuẩn cho hoạt động thu thập thông tin có đạo đức.

Ông tuyên bố:

“…Chúng ta đã thấy trong 30 năm qua rằng các công ty Internet lớn có thể đồng ý về một số tiêu chuẩn tối thiểu, cho dù là vì sợ bị kiện, mong muốn được coi là đơn vị hoạt động có trách nhiệm hay bất cứ điều gì khác.

Một ví dụ đơn giản là robots.txt: nếu bạn muốn trang web của mình không bị các công cụ tìm kiếm lập chỉ mục, bạn có thể chỉ định và các công cụ tìm kiếm chính sẽ tôn trọng điều đó.

Theo cách tương tự, bạn có thể tưởng tượng một thứ gì đó giống như watermark – nếu chúng tôi có thể chứng minh và cho thấy rằng nó hoạt động, rẻ và không ảnh hưởng đến chất lượng của đầu ra và không cần tính toán nhiều, v.v. – điều đó nó sẽ chỉ trở thành một tiêu chuẩn của ngành và bất kỳ ai muốn được coi là có trách nhiệm sẽ đưa nó vào.”

Watermark mà nhà nghiên cứu đã phát triển được dựa trên mật mã (cryptography). Bất kỳ ai có khóa đều có thể kiểm tra tài liệu để xem tài liệu đó có watermark kỹ thuật số cho thấy nó được tạo bởi AI hay không.

Ví dụ, mã có thể ở dạng cách sử dụng dấu chấm câu hoặc trong lựa chọn từ.

Anh ấy giải thích cách hoạt động của watermark và tại sao nó lại quan trọng:

“Dự án chính của tôi cho đến nay là một công cụ để đánh dấu bằng thống kê các đầu ra của một mô hình văn bản như GPT.

Về cơ bản, bất cứ khi nào GPT tạo ra một số văn bản dài, chúng tôi muốn có một tín hiệu bí mật không đáng chú ý trong cách lựa chọn từ ngữ của nó, mà sau này bạn có thể sử dụng để chứng minh rằng, vâng, kết quả này đến từ GPT.

Chúng tôi muốn lấy một đầu ra GPT và chuyển nó đi như thể nó đến từ con người sẽ khó hơn nhiều.

Rõ ràng, điều này có thể hữu ích để ngăn chặn đạo văn học thuật, nhưng cũng có thể giúp tạo ra tuyên truyền hàng loạt… Hoặc giả mạo lối viết của ai đó để buộc tội họ.

Đây là tất cả những thứ người ta có thể muốn ngăn chặn, phải không?”

Nhà nghiên cứu chia sẻ rằng loại watermark này có thể vượt mặt các thuật toán để tránh bị phát hiện.

Nhưng ông cũng tuyên bố rằng kẻ xấu vẫn có thể vượt mặt watermark:

“Bây giờ, tất cả điều này có thể bị đánh bại nếu có đủ nỗ lực.

Ví dụ: nếu bạn sử dụng một AI khác để diễn giải đầu ra của GPT – được thôi, chúng tôi sẽ không thể phát hiện ra điều đó.”

Bạn có nên sử dụng AI cho mục đích SEO?

1. Nội dung AI có thể phát hiện được

Nhiều người nói rằng không có cách nào để Google biết liệu nội dung có được tạo bằng AI hay không.

Tôi không thể hiểu tại sao mọi người lại giữ quan điểm đó vì phát hiện AI là một vấn đề ít nhiều đã được giải quyết.

Ngay cả nội dung triển khai các thuật toán chống phát hiện cũng có thể bị phát hiện (như đã lưu ý trong tài liệu nghiên cứu mà tôi đã liên kết ở trên).

Phát hiện nội dung do máy tạo ra đã là một chủ đề nghiên cứu từ nhiều năm trước, bao gồm cả nghiên cứu về cách phát hiện nội dung được dịch từ ngôn ngữ khác.

XEM THÊM: Bố cục của bài viết chuẩn SEO là gì?

2. Nội dung được tạo tự động vi phạm Nguyên tắc của Google?

John Mueller của Google vào tháng 4 năm 2022 cho biết nội dung do AI tạo ra vi phạm nguyên tắc của Google.

“Đối với chúng tôi, về cơ bản, những thứ này vẫn thuộc danh mục nội dung được tạo tự động, đây là thứ mà chúng tôi đã có trong Nguyên tắc quản trị trang web gần như ngay từ đầu.

Và mọi người đã tự động tạo nội dung theo nhiều cách khác nhau. Và đối với chúng tôi, nếu bạn đang sử dụng các công cụ máy học để tạo nội dung của mình, thì về cơ bản, điều đó cũng giống như việc bạn chỉ xáo trộn các từ xung quanh hoặc tra cứu các từ đồng nghĩa hoặc thực hiện các thủ thuật dịch thuật mà mọi người thường làm. Hoặc những hành động tương tự.

Tôi nghi ngờ rằng có thể chất lượng nội dung tốt hơn một chút so với các công cụ cũ, nhưng đối với chúng tôi, đó vẫn là nội dung được tạo tự động và điều đó có nghĩa là đối với chúng tôi, nội dung đó vẫn vi phạm Nguyên tắc quản trị trang web. Vì vậy, chúng tôi sẽ coi đó là spam.”

Google gần đây đã cập nhật phần nội dung “được tạo tự động” trên trang dành cho nhà phát triển của họ về spam.

Được tạo vào tháng 10 năm 2022, nó được cập nhật vào gần cuối tháng 11 năm 2022.

Những thay đổi này làm rõ về nguyên nhân khiến nội dung được tạo tự động trở thành spam.

Ban đầu nó nói thế này:

“Nội dung được tạo tự động là nội dung được tạo theo chương trình mà không tạo ra bất kỳ thứ gì gốc hoặc bổ sung đủ giá trị;”

Google đã cập nhật câu đó để bao gồm từ “spam”:

“Nội dung Spam được tạo tự động là nội dung được tạo theo chương trình mà không tạo ra bất kỳ thứ gì gốc hoặc bổ sung đủ giá trị;”

Thay đổi đó dường như để làm rõ rằng nội dung được tạo tự động không khiến nội dung trở thành spam. Việc thiếu tất cả các giá trị gia tăng và phẩm chất chung chung là “spam” khiến nội dung đó trở nên có vấn đề.

Cách sử dụng AI tốt nhất cho SEO

Việc sử dụng tốt nhất các công cụ AI là để mở rộng quy mô SEO theo cách giúp nhân viên làm việc hiệu quả hơn. Điều đó thường bao gồm việc để AI thực hiện công việc nghiên cứu và phân tích tẻ nhạt.

Dùng chatGPT viết content SEO

Việc tóm tắt các trang web để tạo mô tả meta có thể là một cách sử dụng được chấp nhận, vì Google đặc biệt nói rằng điều đó không trái với nguyên tắc của họ.

Sử dụng ChatGPT để tạo dàn bài hoặc tóm tắt nội dung có thể là một cách sử dụng thú vị.

Dùng ChatGPT viết Content SEO và xuất bản nguyên trạng nội dung đó có thể không phải là cách sử dụng AI hiệu quả nhất, nếu nó không được đánh giá đầy đủ về chất lượng, độ chính xác và tính hữu ích.

Nguồn: searchenginejournal

ATPWEB – XÂY DỰNG NGÔI NHÀ ONLINE

Liên hệ:

  • Hotline: 0707 6666 56
  • Fanpage: ATP Web
  • Website: atpweb.vn
Đánh giá bài viết post

Leave a Comment

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

LIÊN HỆ TƯ VẤN

Thiết Kế Web
BLOG
Đăng ký tư vấn
Thiết kế website
Đồng hành cùng ATP WEB

Đăng ký tư vấn Thiết kế website