Google Panda: SEOs tìm hiểu hoạt động bên trong của thuật toán này

Khái niệm về một công cụ tìm kiếm là rất đơn giản. Xác định cơ sở dữ liệu vị trí của trang và trả về kết quả có liên quan nhất.

Công cụ tìm kiếm nguyên thủy chỉ hiểu chữ trên các trang web trong cơ sở dữ liệu của họ và trả về các trang bao gồm những từ tìm kiếm. Google sắp xếp lại những kết quả tìm kiếm dựa trên số trang khác trên Internet được kết nối với họ.

Kể từ đó Google và các công cụ tìm kiếm khác đã được cải thiện các yếu tố xếp hạng cơ bản và phát triển hàng ngàn cách để sắp xếp lại kết quả tìm kiếm vì vậy chỉ kết quả phù hợp nhất được hiển thị cho người dùng. Ví dụ như “sự tươi mới” của nội dung hoặc vị trí của nơi tìm kiếm đã diễn ra. Điều này quan trọng cho ngành SEO đang phát triển trên thế giói trong đó có Việt Nam.

Panda chỉ là một cách của Google sắp xếp lại kết quả dựa trên chất lượng nội dung của một trang web.

Trong bài viết này chúng tôi suy đoán một cách chi tiết những gì có thể học được từ “Bằng sáng chế Panda”. Thuật ngữ này được sử dụng thường xuyên, mơ hồ và đôi khi làm cho nó khó khăn để hiểu, vì vậy đây là một khái niệm nhanh chóng sẽ giúp bạn dễ hiểu hơn.

  1. Panda làm mới việc thu thập thông tin về các liên kết và truy vấn liên quan đến một trang web.
  2. Sau khi người dùng tìm kiếm, mỗi kết quả danh sách (URL/trang) đưa ra một số điểm ban đầu dựa trên sự liên quan để tìm kiếm và chất lượng trang.
  3. Tính toán của thứ hạng#1 và #2 xác định xem kết quả danh sách (URL/trang) là trên hoặc dưới một ngưỡng.
  4. Kết quả được sắp xếp lại theo giá trị cuối cùng.

Nhìn lại thuật toán Panda

Quay trở lại tháng 2 năm 2011, Google phát hành một thay đổi lớn trong cách họ sắp xếp kết quả tìm kiếm. Trong đó họ giải thích:

Bản cập nhật này được thiết kế để làm giảm thứ hạng cho các trang web chất lượng thấp, các trang web có giá trị thấp đối với người sử dụng, sao chép nội dung từ các trang web hoặc nội dung không hữu ích.

Họ tiếp tục nói:

… nó quan trọng đối với các trang web chất lượng cao để được khen thưởng, và đó là chính xác những gì thay đổi điều này.

Panda nhìn vào chất lượng nội dung vì nó liên quan đến một trang web.

Google Panda

Tóm lại, Google chỉ định mỗi trang đủ điều kiện để kết quả tìm kiếm một giá trị sắp xếp lại kết quả tìm kiếm cho bất kỳ truy vấn cụ thể dựa trên chất lượng của nhóm (ví dụ, một trang web) trang có liên quan. Đó là một bản tóm tắt và có vẻ như phức tạp để lập trình tự động hóa.

Danny Sullivan, người sáng lập của Search Engine Land, nói đến điều này trong một bài báo xuất bản bốn tháng sau khi giới thiệu Panda, “Ngay bây giờ, đó là sức mạnh tính toán quá nhiều để được chạy phân tích cụ thể của các trang. Thay vào đó, Google chạy các bộ lọc định kỳ để tính toán các giá trị cần thiết”.

Chúng tôi đã đến để biết những gì được mô tả ở đây là làm mới, đánh dấu sự kiện của các trang web nhận được một hình phạt hoặc phần thưởng từ Panda.

Lưu ý: (theo Google này gần đây đã được tích hợp vào quy trình bình thường của họ, do đó không còn phải “làm mới”).

Nhanh chóng chuyển tiếp 3 năm và hơn 25 bản cập nhật Panda khi Bill Slawski phát hiện ra một bằng sáng chế đã được cấp với tên Navneet Panda, các kỹ sư của Google, người là tác giả của bản cập nhật Panda. Bill lưu ý rằng Panda “là nhằm mục đích cải thiện kết quả tìm kiếm hơn là xử phạt các trang web hoặc xác định nỗ lực để thao túng kết quả tìm kiếm”.
Đây là một khác biệt quan trọng khi so sánh Panda với các cập nhật khác của Google.

Để giúp cung cấp một số bối cảnh để phân tích bằng sáng chế dưới đây, chúng ta sẽ gọi nhóm mới dựa trên điểm chất lượng Google tạo ra thứ hạng Panda. Trong thơ ca ngợi cách Google ban đầu xác định trang có liên quan cho các truy vấn, PageRank.

Danh hiệu bằng sáng chế Panda

Nhiều như chúng tôi có thể thu thập từ sự phức tạp của một bằng sáng chế, Panda trong một bản tóm tắt cơ bản
nhất dường như đã là một quá trình gồm hai phần. Cho mỗi URL đủ điều kiện cho một truy vấn tìm kiếm cụ thể:

Một số điểm ban đầu được tạo ra – mức URL, liên quan đến truy vấn, và/hoặc điểm chất lượng.
Nếu có thể, các yếu tố thay đổi theo nhóm đã được áp dụng.

Điểm ban đầu:
Bước đầu tiên trong việc tạo ra Panda là tạo ra một số điểm ban đầu cho mỗi danh sách URL trong bối cảnh
của một truy vấn cụ thể. Bằng sáng chế đi vào chi tiết hơn, “… một thước đo của sự liên quan của các nguồn tài
nguyên (danh sách URL) để truy vấn tìm kiếm, một thước đo của chất lượng của tài nguyên (danh sách URL), hoặc cả hai”.

BƯỚC MỘT: Với thuật ngữ tìm kiếm, gán giá trị ban đầu cho tất cả các URL đủ điều kiện dựa trên:

Liên quan đến truy vấn.
Đo lường chất lượng.
Suy đoán số điểm ban đầu và tóm tắt.

Điểm ban đầu được tạo ra từ các yếu tố mà không mới. Panda là đặc biệt bởi vì nó là một cách khả thi để tự động
sắp xếp lại kết quả tìm kiếm dựa trên nhóm VS chất lượng URL.

Nhóm Dựa Trên Sửa Yếu Tố Sửa Đổi

Một khi một số điểm ban đầu đã được tạo ra cho tất cả các URL cho một truy vấn tìm kiếm nhất định, số điểm sau đó
được sửa đổi dựa trên chất lượng của nhóm các URL đã được chỉ định.

Thuat toan Google Panda

Một trang web là một loại nhóm, Google đề cập đến giải quyết dựa trên nhóm nhiều lần trong các bằng sáng chế nhưng khả năng cung cấp những gì một nhóm có thể là:

… một phần của tài nguyên trên Internet. Một nhóm có thể được xác định trong bất kỳ của một loạt các cách khác nhau. Một nhóm địa chỉ dựa trên các nguồn tài nguyên là một nhóm các nguồn lực được xác định bởi các địa chỉ Internet, ví dụ như, Uniform Resource Locators (URLs), các nguồn tài nguyên trong nhóm. Các nguồn lực được nhóm lại để một nguồn tài nguyên không thể được bao gồm trong nhiều nhóm tài nguyên. Ví dụ, một nhóm các nguồn lực có thể bao gồm các tài nguyên này có thể được truy cập bằng cách sử dụng một tên miền cụ thể.
Có nghĩa là, nhóm có thể bao gồm http://www.domain.com/resource1, http://wwww.domain.com/resource2,
http://www.domain.com/resourceN, và như vậy, mà không quan tâm đến khi các nguồn lực đầu tiên trở thành có sẵn cho 130 công cụ tìm kiếm để lập chỉ mục. Ngoài ra, một nhóm các nguồn lực có thể bao gồm các tài nguyên này có thể được truy cập bằng cách sử dụng một tên máy chủ cụ thể, ví dụ, http://host.example.com/resource1, http://host.example.com/resource2, http:// host.example.com / resourceN, và như vậy. Nhóm địa chỉ khác dựa trên là có thể.
Ví dụ, một nhóm đặc biệt có thể chỉ bao gồm một phần của các nguồn tài nguyên có thể được truy cập bằng cách sử dụng một tên máy chủ cụ thể hoặc một tên miền cụ thể.

Bằng sáng chế nói giống như dự án mà bất cứ điều gì cũng có thể, có ý nghĩa cho các mục đích kiện tụng.

BƯỚC HAI: Sau khi số điểm ban đầu được gán cho các URL đủ điều kiện được đưa ra một thuật ngữ tìm kiếm, sửa đổi điểm theo chất lượng của các nhóm mà chúng có liên quan. Đối với tất cả các URL trong một nhóm, điểm số chất lượng dựa vào việc xác định một số của:

Truy vấn tham khảo.
Liên kết độc lập.
Tham khảo số lượng truy vấn nhóm.

Một truy vấn tham chiếu là khi một người tìm kiếm sử dụng một truy vấn tìm kiếm để tìm một URL cụ thể.

Lưu ý: Chi tiết được cung cấp về các truy vấn tham chiếu trong Lưu đồ Panda và tóm tắt bên dưới.

Đếm Nhóm Liên Kết Độc Lập

Liên kết độc lập đặc biệt “hiệu đính” liên kết trỏ đến một URL.

Nhóm Dựa Vào Sửa Đổi Và Tóm Tắt

Panda xem sự liên quan của URL ban đầu và điểm chất lượng để biến đổi chúng theo một yếu tố nhóm dựa vào truy vấn tài liệu tham khảo và các liên kết độc lập.

Lưu đồ Panda

Những hình ảnh dưới đây mô tả sáng chế lưu đồ thuật toán của Panda

Tạo điểm ban đầu cho tất cả các danh sách URL đủ điều kiện cho một truy vấn tìm kiếm nhất định.
Xác định xem truy vấn là điều hướng, nếu có để lại số điểm ban đầu một mình.
Nếu số điểm ban đầu của URL dưới đây, nhóm ngưỡng điểm chất lượng, sửa đổi điểm ban đầu.
Lặp lại.

Lưu ý: Trong các bằng sáng chế thực tế, họ dường như đề cập đến một URL như là một “tài nguyên”.

 

luu do thuat toan Panda

Lưu đồ thuật toán Panda của Google

Lưu đồ thuật toán Panda và tóm tắt

Một khía cạnh khó hiểu của lưu đồ Panda là những gì khác biệt giữa các truy vấn định hướng và tham khảo có thể được. Chúng tôi nghĩ rằng các truy vấn định hướng có thể có một cái gì đó cho biết tên thương hiệu trong truy vấn chính nó.

Một cái gì đó như tìm kiếm [giày nike trên Zappos] có thể được coi là một truy vấn hướng. Truy vấn tài liệu tham khảo có thể dựa trên thời gian. Nếu ai đó sử dụng một tìm kiếm và nhấp chuột vào một liên kết trong một khung thời gian nhất định nó có thể được gắn cờ là một “truy vấn tham khảo”.

Một khía cạnh khác thú vị của lưu đồ này để xem xét là khả năng của nhiều ngưỡng. Nó có ý nghĩa rằng Google muốn có một yếu tố chất lượng dựa trên trang web hoặc một nhóm các URL và thấy rằng với Panda, nhưng có nhiều ngưỡng có thể có kết quả khác nhau. URL danh sách cho một truy vấn tìm kiếm nhất định có thể là:

  • Tác động tiêu cực bởi nhiều yếu tố điểm số theo nhóm.
  • Tác động tiêu cực bởi một yếu tố điểm số theo nhóm và tác động tích cực của người khác.
  • Tác động tích cực bởi nhiều yếu tố điểm số theo nhóm.

Các bằng sáng chế chỉ ra, “Tài nguyên được nhóm lại để một nguồn tài nguyên không thể được bao gồm trong nhiều nhóm tài nguyên”.

Mặc dù điều này đang được nói, một suy nghĩ là một URL có thể có yếu tố thay đổi áp dụng dựa trên cả hai địa chỉ và nhóm không địa chỉ nhóm.

Google có thể thiết lập địa chỉ dựa trên yếu tố sửa đổi để có nhiều hơn một tác động trên một URL hơn nhóm không địa chỉ. Hiệu quả demoting URL/trang có vấn đề trùng lặp nội bộ đến một mức độ cao hơn so với các URL/trang với các vấn đề nhân bản bên ngoài.

Dọc theo cùng một dòng suy nghĩ, nếu một trang có vấn đề về chất lượng nhóm cả bên trong và bên ngoài, nó có thể bị ảnh hưởng tiêu cực đến hai lần.

Thuật toán Panda ngày nay và các yếu tố xếp hạng

Không nói về các chi tiết, có một điều chúng ta có thể đồng ý là điểm chất lượng trang web và nhóm dựa trên một yếu tố xếp hạng trong kết quả tìm kiếm của Google ngày hôm nay. Không có nghi ngờ mọi thứ đã thay đổi kể từ bằng sáng chế này đã được viết, nhưng nó dường như cung cấp một số cái nhìn sâu sắc có giá trị trong cách suy nghĩ và làm thế nào để tránh và khắc phục Panda của Google.

Như được mô tả trong bằng sáng chế, các URL được cho điểm duy nhất được sửa đổi theo bất kỳ truy vấn tìm kiếm. Hơn nữa, có yếu tố thay đổi là năng động tùy thuộc vào bao giờ thay đổi biến. Mà dịch để Panda có một tác động khác nhau trên mỗi URL. Mà làm cho lượng khó khăn, nhưng có những yếu tố đã được thảo luận chi tiết ở trên để xem xét tiếp tục kết hợp vào thực hành tốt nhất:

Các yếu tố xếp hạng URL Panda

  1. Liên quan đến truy vấn.
  2. Chất lượng.

Các yếu tố thứ hạng nhóm.

  • Đếm các truy vấn tham khảo.
  • Đếm các liên kết độc lập.

Bằng sáng chế Panda chính nó là một sự thú vị. Bạn chắc chắn nên kiểm tra phân tích SEO của Bill Slawksi, nơi ông đi vào chi tiết hơn của một số trong những yếu tố Panda.

Leave a Reply

Your email address will not be published. Required fields are marked *


+ 6 = eleven

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>