Thuật toán mới của Google, Google Penguin

Một thời gian sau khi Google Penguin ra đời, Google vui mừng vì thuật toán chống spam mới này đang hoàn thiện như dự định. Nhưng có một vài điều tổn hại do thuật toán này gây ra còn đang được cân nhắc cách khắc phục và vẫn còn những mối bận tâm về Negative SEO như một mối đe doạ. Matt Cutt, Trưởng nhóm Webspam của Google có đưa ra một số ý kiến trong một cuộc phỏng vấn như sau:

Thuật toán Google Penguin: "Là một sự thành công"

Mục đích của bất kỳ lần cập nhật thuật toán là cải thiện kết quả tìm kiếm. Vậy, Penguin đã cải thiện như thế nào cho Google?

"Theo quan điểm của chúng tôi thì đây là một thành công" - Matt Cutt nói

Còn những kết quả bất thường thì sao?

Chắc chắn rằng ngay sau khi Peguin ra đời, người ta nhanh chóng dẫn ra các ví dụ về các kết quả dư thừa. Ví dụ như trang Viagra chính thức không được liệt kê trong khi những trang khác bị hack lại được liệt kê vào. Một trang website trống được liệt kê nhằm mục đích "kiếm tiền qua mạng" và có nhiều trang trống khác có thứ hạng cao. Các trang sao chép nội dung – Scamr sites thì được báo cáo là vượt thứ hạng so với những trang bị sao chép.
Vậy thì Penguin thành công như thế nào khi những loại trường hợp này xảy ra?

Matt Cutt nói rằng nhiều vấn đề đã có trước khi Penguin ra đời và những vấn đề này không phải do thuật toán chống spam mới này gây ra.

Thực tế, vấn đề của Viagra hiện giờ được xác định là vấn đề có trước khi Penguin ra đời. Do vậy, Penguin không gây ra vấn đề này.

Còn những khẳng định sai ở một số ít tình huống?

Những khẳng định sai trong trường hợp người ta thấy rằng trang của họ đã bị thuật toán Penguin đánh sai khi họ không làm spam?

Matt Cutt cho biết "Chúng tôi đã xem xét một vài tình huống cần điều tra thêm nhưng sự thay đổi này chưa có tác động như thuật toán Panda hay Florida"

Thuật toán mới của Google, Google Penguin, Penguin
Thuật toán mới của Google, Google Penguin, Penguin

Google cập nhật thuật toán Panda với mục đích loại bỏ những nội dung rác, nội dung copy, loại bỏ những website có thương hiệu kém vào năm ngoái. Thuật toán Florida là một cập nhật quan trọng của Google năm 2003 nhằm cải thiện chất lượng tìm kiếm.

Tôi đồng ý rằng cả hai thuật toán trên dường như có tác động tới nhiều trang hơn thuật toán Penguin. Tôi đưa ra quan điểm như vậy dựa trên việc theo dõi các phản ứng với tất cả các cập nhật này. Chắc chắn rằng không phải tất cả mọi người sẽ đồng ý với tôi. Điều này cũng như lời nhắc nhở thường xuyên rằng bất cứ trang nào bị rớt khỏi thứ hàng thì trang khác dành được thứ hạng. Các bạn ít khi nghe điều này từ những ai dành được thứ hạng.

Điểm mấu chốt ở đây là Google dường như tin rằng thuật toán Penguin thực sự tóm được những kẻ spam đúng theo ý định của Google.

Tại sao Spam vẫn "lọt lưới"

Chắc chắn khi tôi nhìn vào các báo cáo, tôi thường thấy spam là cốt lõi của nguyên nhân khiến ai đó bị rớt hạng. Nhưng nếu thuật toán Penguin có hiệu lực thì tại sao một vài trang rõ ràng spam vẫn lọt qua?

"Không có thuật toán nào là hoàn hảo cả. Khi chúng tôi muốn sự hoàn hảo, phương pháp thử nghiệm của chúng tôi là 'Làm những gì để có kết quả tốt hơn trước'" - Matt Cutt cho biết vậy.

Thuật toán mới của Google, Google Penguin, Penguin - 01
Thuật toán mới của Google, Google Penguin, Penguin

Matt Cutt cũng giải thích rằng thuật toán Penguin được thiết kế hoàn toàn chính xác. Nó hoạt động chống lại các trang dính níu đến spam.Tuy một vài spam vẫn có thể lọt qua nhưng mặt tích cực của nó thì bạn lại có một số những khẳng định sai.

Bạn có thể khôi phục bằng cách nào?

Một trong số những khó khăn nhất với lần cập nhật này là nói cho mọi người biết cách khôi phục. Bất cứ trang nào nào bị Penguin đánh vào đều được tin là đang spam Google.

Trước kia, nếu bạn spam Google, người ta nói rằng bạn phải lưu khiếu nại bằng hình thức Reconsideration request. Tuy vậy, Google đã nói rõ rằng hình thức khiếu nại reconsideration request không giúp ích gì cho nhữn trang bị thuật toán Penguin đánh vào. Google cũng cho biết yêu cầu này sẽ tự khôi phục nếu họ xóa sạch spam.

Tuy nhiên, một trong những lý do chính tôi nhận thấy khi xem các trang bị thuật toán Penguin đánh vào có thể là do các trang này đang thực hiện các kết nối xấu. Mọi người đã sử dụng WordPress themes miễn phí (WordPress là một phần mềm mã nguồn mở miễn phí mà bất kỳ ai cũng có thể sử dụng để xây dựng một website hay blog) hoặc sử dụng các đường kết nối tương hỗ chất lượng kém, mua link hoặc tham gia vào các mạng kết nối như những mạng gần đây Google đang chống lại.

Vậy mọi người có thể tự thoát khỏi các mạng kết nối này như thế nào, nếu họ không có sự kiểm soát với các link này bây giờ?

"Có thể xóa sạch những link này" Matt Cutt nói như vậy đồng thời đưa ra đề nghị rằng mọi người nên xem xét lại hai video ông đã thực hiện về chủ đề này:

Hãy truy cập Penguin để cập nhật lại

Nếu bạn xóa sạch các thứ rồi thì bạn biết Penguin được cập nhật bằng cách nào? Một cách lý tưởng thì bạn sẽ xem lưu lượng từ phục hồi của Google để biết thời gian tới Penguin được cập nhật.

Điều này dẫn tới một điểm quan trọng khác. Đó là thuật toán Penguin cũng như Panda là một bộ lọc, đôi khi được làm mới. Thuật toán Penguin không hoạt động liên tục nhưng hơn thế nó được dùng để tag kiểu như spam ngoài phạm vi bộ lọc spam định kỳ của Google.

Thuật toán mới của Google, Google Penguin, Penguin - 02
Thuật toán mới của Google, Google Penguin, Penguin

Có phải thuật toán Penguin là một sự trừng phạt rộng rãi các trang hoặc trang cụ thể nào đó giống như thuật toán Panda? Nhưng căn cứ vào việc Panda có ảnh hưởng rộng tới các trang thì tôi cho rằng giả định thuật toán Penguin cũng làm được như vậy là công bằng thôi.

Theo như Matt Cutt thì điều này có nghĩa là nếu một vài trang của trang web của bạn bị tưởng là giống Penguin, thì tất cả có thể cũng bị tưởng như vậy. Cũng như vậy, khôi phục nghĩa là xóa sạch spam. Nếu bạn đã xóa rồi và vẫn chưa khôi phục được thì cuối cùng bạn cần bắt đầu một trang mới.

Một bận tâm mới về SEO mang tính tiêu cực

Trước khi có thuật toán Penguin, buổi trò chuyện về "negative SEO" – SEO mang tính tiêu cục đều chưa đi đến đầu đến đũa. Kể từ sau đó, dường như nó càng tệ hơn. Tôi đã xem những website mà nghe có vẻ như ai đó đang bị nguy hiểm nghiêm trọng vì đối thủ cạnh tranh có thể hãm hại họ.

Cốt lõi những nỗi sợ hãi này dường như một loạt giả định hoàn hảo. Gần đây Google hướng tới một số mưu đồ kết nối. Điều này khiến một vài người mất lưu lượng. Google cũng đã gửi những cảnh báo về các trang có đường link “giả mạo” hoặc “bất thường”. Việc này đã tạo ra nhiều lo lắng hơn cho một số ai đó. Sau đó, Penguin Update xuất hiện và đánh các link này, khiến càng nhiều người mất lưu lượng vì họ bị thuật toán Penguin Update đánh vào hoặc là không còn hưởng lợi từ spam link đã bị quét.

Những thứ này tạo độ chín muồi để mọi người khẳng định rằng việc chỉ ra các link xấu ở một trang web có thể tổn hại nó. Nhưng như tôi đã viết trước đó thì mối bận tâm về SEO mang tính tiêu cực không còn mới. Các SEO mang tính tiêu cực đã có từ nhiều năm nay rồi. Dù vậy, chúng ta chưa nhận thấy nó là mối bận tâm lớn.

Google đã nói rằng không dễ dàng gì cho những kẻ khác gây hại một trang web và thực tế thì có vẻ chỉ là trường hợp hy hữu thôi. Nói cụ thể thì việc chỉ ra các link xấu ở một trang tốt có các dấu hiệu tốt giống như là đang cố gắng lây truyền bệnh dịch cho một cơ thể mà nó có kháng thể rồi. Những điều tốt đẹp có sức nặng hơn những điều xấu.

Matt Cutts nhấn mạnh lại rằng SEO mang tính tiêu cực này rất hiếm có. Ông cho biết “Chúng tôi đã nỗ lực làm việc rất nhiều để đảm bảo chắc chắn rằng một ai đó cũng không thể gây tổn thương tới người khác”

Đồng thời, Matt Cutts lưu ý những gì Google nói trước kia. Hầu hết 700.000 thông điệp Google gửi tới công chúng đầu năm nay không phải là về các mạng lưới link xấu. Một cách tình cờ thì các thông điệp này không được viết cùng một ngày. Hơn thế, nhiều trang có cả những hình thức phạt Algorithmic penalty (Hình thức phạt giống của thuật toán Panda) và Manual penalty (Phạt xem xét thủ công) có kèm theo chúng nhưng chưa bao giờ tiết lộ. Gần đây, Google đã quyết định mở ra những trang này.

Sau chiến dịch SEO mang tính tiêu cực là cảnh báo link

Chắc chắn, khi một thông điệp mới đưa ra, nó có thể dẫn tới trường hợp như của Dan Thies. Trang của anh ta bị một số nhằm vào để cố gắng phô trương các công việc SEO mang tính tiêu cực. Anh ta nhận được một cảnh báo link bất thường sau khi điều này xảy ra. Anh ta cũng bị rớt một vài thứ hạng. Đây phải chăng là bằng chứng các công việc của SEO mang tính tiêu cực?

Thies nói với tôi rằng thứ hạng anh ta mất có khả năng do những thay đổi mà bản thân anh ta tự tạo ra khi anh ta gỡ bỏ link qua tất cả các trang trên trang web của anh ta để quay trở về trang chủ của anh ấy. Sau khi phục hồi lại, anh ta nói với tôi là anh ấy đã dành lại được các thứ hạng của mình.

Anh ấy nói toàn bộ lưu lượng không tệ đi. Dường như nó không giống như những mối lo ngại rằng SEO mang tính tiêu cực là một đe dọa “tàng hình” vì nếu nó đã làm việc đủ để tag trang web của anh ta như một phần việc của Penguin Update thì đáng lẽ anh ấy bị rớt hạng khủng khiếp.

Còn cảnh báo link thì sao? Thies đã tin rằng cảnh báo link xuất hiện do nỗ lực của SEO mang tính tiêu cực. Quả là một điều đáng sợ. Anh ta cũng nói rằng anh ấy lưu 3 hình thức khiếu nại reconsideration request mà mỗi lần đều có thư phản hồi nói rằng không tìm thấy hoạt động spam nào. Có phải anh ấy bị đánh bởi một cảnh báo nhưng không có cái nào liên quan tới lệnh trừng phạt?

Tôi đã hỏi Matt Cutts về tình huống này nhưng ông từ chối bình luận về trường hợp cụ thể của Thies. Ông nói rằng thông thường thì một cảnh báo link là một thông báo trước về việc rớt thứ hạng. Nếu trang web cố định vấn đề rồi và thực hiện thao tác khiếu nại reconsideration request đủ nhanh thì có thể ngăn được khả năng rớt thứ hạng.

Giải tỏa một số những lo lắng

Thuật toán mới Google Penguin

Tôi mong muốn chúng ta sẽ tiếp tục thảo luận về SEO mang tính tiêu cực này và tin chắc rằng nó cũng là mối bận tâm lớn cho bất cứ ai. Tôi đã tham gia một buổi thảo luận về Quyến sách SEO cũng rất đáng để đọc.

Khi việc mua link rẻ hơn bao giờ, chúng ta sẽ dễ thấy tại sao phải bận tâm, lo lắng. Những câu chuyện giả dụ như điều gì đã xảy ra với Thies hoặc người nhận được cảnh báo sau khi 24.000 link hiển thị được chỉ ra ở trang web của anh ta gây ra phiền toái.

Lại sau đó, người này đi cảnh báo sau khi rõ ràng là anh ta đã làm rớt thứ hạng bởi thuật toán Penguin. Các link SEO mang tính tiêu cực cũng thực sự gây ra sự rớt hạng này hay còn một cái gì đó nữa chăng? Nói theo cách phổ biến thì thật khó nói vì các trang thực sự thì lại không được cung cấp.

Phức tạp vấn đề hơn nữa, một vài người mà làm mất lưu lượng vì thuật toán Penguin có thể lại không phải là nạn nhân của lệnh trừng phạt. Hơn thế nữa, Google có thể đã ngừng cho phép một số link vượt qua độ tin cậy (pass credit) nếu những link này bị nghi là một phần của nỗ lực đẩy thứ hạng trang vi phạm điều luật SEO. Nếu các trang bị lệ thuộc nhiều vào các link giả mạo thì các trang này sẽ thấy rớt hạng chỉ vì độ tin cậy của link bị xuống cấp chứ không phải vì chúng phải chịu trừng phạt.

Tôi đã thấy rất nhiều người hiện giờ công khai mong ước cách “disvow – không chỉ ra các link ở website của họ. Google không có ý kiến gì về việc bổ sung thêm tính năng như vậy lúc này khi tôi hỏi về điều này. Chắc chắn tôi không chờ đợi nó bây giờ. Bạn cũng vậy thôi nếu bạn biết rằng bạn đã từng bị thuật toán Penguin đánh vào. Tôi sẽ làm những gì tôi có thể để xóa sạch các thứ đi.

Một đề nghị thú vị ngoài cuộc thảo luận về Quyển sách SEO là Google không nên trừng phạt các trang web vì chỉ ra các link xấu ở trong trang đó. Hãy bỏ qua các link này, đừng để các link này vượt qua độ tin cậy (pass credit). Đây là một đề nghị tuyệt vời nhằm xoa dịu mối lo lắng về SEO mang tính tiêu cực như tôi thường nói.

>>> SEO thời kì hậu HummingBird - Thuật toán chim ruồi
>>> Series bài viết về thuật toán HummingBird của Google

Bài viết " Thuật toán mới của Google, Google Penguin "
Công ty thiết kế website chuyên nghiệp ADC Việt Nam

  • Làm thế nào để vượt qua đối thủ cạnh tranh?

  • Bạn cần website để giới thiệu dịch vụ?

  • Cho đến lúc này, điều mà bạn đang quan tâm có lẽ là muốn tìm hiểu thêm về dịch vụ thiết kế website và Công ty chúng tôi?

  • SỞ HỮU NGAY WEB CHUYÊN NGHIỆP TẠI ADC VIỆT NAM ĐỂ VƯỢT QUA ĐỐI THỦ NGAY HÔM NAY!!!