Google đang crawling và indexing những gì?

SEO như một biển rộng lớn và sâu thẳm. Để hiểu được SEO, chúng ta nên biết đến một số các khái niệm SEO. CrawlingIndexing là hai khái niệm trong đó.

Nếu bạn đã ở trong thế giới web được một thời gian, bạn ít nhất chắc cũng đã nghe đến các từ:

Google Crawling và Indexing.

Đây là hai phạm trù mà cả thế giới web đều bị chi phối. Hãy cùng định nghĩa, hiểu và có một vài thông tin sâu hơn về Crawling và Indexing.

Crawling:

Khi Google ghé vào website để thực hiện mục đích theo dõi. Quá trình này được thực hiện bởi Spider crawler của Google

Indexing:

Sau khi việc crawling đã hoàn thành, các kết quả được đưa đến index của Google (ví dụ như tìm kiếm web)

crawling và indexing
Google Crawling là gì?

Crawling cơ bản có nghĩa là đi theo một con đường mòn.

Trong thế giới của SEO, crawling có nghĩa là đi theo các links  và “di chuyển quanh” website của bạn. Khi các bots đến website của bạn (bất kỳ trang nào), chúng theo dõi các trang được liên kết cũng trên website.

Đây là một lý do cho việc tại sao chúng ta tạo ra các sitemaps, vì chúng có chứa tất cả các đường links trong blog của chúng ta và các bots của Google có thể sử dụng chúng để nhìn sâu hơn vào một website.

Cách mà chúng ta có thể ngừng việc crawling các phần nhất định của trang bằng việc sử dụng Robots.txt file.

Google indexing là gì?

Trong phạm trù của những người ngoài ngành thì indexing là quá trình thêm các trang web vào tìm kiếm của Google.

Dựa vào meta tag nào mà bạn sử dụng (index hoặc no-inex), Google sẽ crawl và index các trang của bạn. Một no-index tag có nghĩa là trang đó sẽ không bị thêm vào chỉ mục của tìm kiếm web.

  • Theo mặc định thì mọi bài post và page của WordPress sẽ được lập chỉ mục.

Một ý tưởng tốt cho việc xếp hạng cao hơn trong các công cụ tìm kiếm là chỉ để các phần quan trọng trong blog/website của bạn được chỉ mục.

Đừng index các archive không cần thiết như tags, categories, và tất cả các trang không hữu ích.

Các yếu tố ảnh hưởng đến crawling:

Có hàng triệu các websites trên toàn thế giới. Liệu tất cả mọi người có hài lòng với tỷ lệ crawling và indexing?? Không!! Phần lớn mọi người liên tục có thắc mắc rằng tại sao các bài viết của họ không được lập chỉ mục.

Hãy cùng xem đến một vài yếu tố chính mà đóng vai trò quan trọng trong backend của việc crawling và indexing.

Tên miền

Từ khi Google Panda được cập nhật, tầm quan trọng của tên miền ngày càng cải thiện một cách đáng kể. Các tên miền bao gồm các từ khóa chính là rất quan trọng.

Thêm nữa, tỷ lệ crawling cao hơn với những tên miền mà có một thứ hạng trang tốt.

Backlinks

Bạn càng có nhiều backlinks, bạn lại càng trở nên đáng tin và danh tiếng hơn trong mắt các công cụ tìm kiếm.
Nếu bạn có thứ hạng tốt nhưng vẫn không có được bất kỳ backlinks nào cho trang của mình, thì các công cụ tìm kiếm có thể giả định rằng bạn có các nội dung chất lượng thấp.

Liên kết nội bộ

Đã có rất nhiều các cuộc thảo luận liên quan đến việc liên kết nội bộ (cũng được biết đến là liên kết sâu). Mọi người thậm chí khuyên nên sử dụng cùng một anchor text trong cùng một bài viết vì nó sẽ giúp việc crawling sâu vào một trang.

Điều quan trọng phải nhớ là việc liên kết nội bộ là một thông lệ tốt, không chỉ cho SEO, mà còn cho việc duy trì những người dùng hoạt động trên website của bạn.

XML Sitemap

Khoảnh khắc mà bạn thiết lập một trang trong WordPress, bạn sẽ được khuyên sử dụng một XML Sitemap, như vậy thì sitemap của bạn có thể được tạo ra một cách tự động. Theo cách này, Google sẽ thông báo với bạn rằng trang của bạn đã được cập nhật và họ sẽ muốn crawl trang.

Trùng lặp nội dung

Điều này có thể thực sự không tốt cho bạn.

Gần đây, tôi có tìm thấy một trang có quá nhiều các đoạn văn bị lặp lại qua các bài đăng khác nhau. Do đó trang web này đã bị cấm bởi Google.

Hãy cố đừng lặp lại bất cứ nội dung nào trên trang web.

Khắc phục tất cả các chuyển hướng 301 hoặc 404 để crawling và SEO được tốt hơn.

URL Canonicalization

Hãy tạo ra các URLs thân thiện với SEO cho mỗi trang trên website.

Điều này rất quan trọng để có SEO hợp lý.

Meta Tags

Hãy thêm vào website của bạn các meta tags độc đáo và không cạnh tranh. Điều này sẽ đảm bảo rằng bạn có được thứ hạng cao trong các công cụ tìm kiếm.

Pinging

Hãy đảm bảo là bạn đã thêm vào tất cả các trang ping chính đến trang WordPress. WordPress có một tính năng pinging tự động mà sẽ thông báo đến các công cụ tìm kiếm về các cập nhật trên trang wordpress.

Khi bạn tốt ưu hóa website của mình dựa trên những yếu tố trên, Google sẽ không có sự lựa chọn nào khác hơn là crawl và index trang web nhanh hơn và chính xác hơn.

Bạn đã làm gì để có được việc indexing nhanh hơn cho website của mình? Hãy tham gia vào phần thảo luận trong các bình luận bên dưới nhé!

Bạn có thấy hướng dẫn này hữu ích chứ? Hãy chia sẻ nó với bạn bè của mình trên Facebook, Twitter, và Google Plus nhé!

Về tác giả

Duy Anh

Chào các bạn,

Mình là coder, đang sống và làm việc ở Mỹ. Mình thích viết lách nên muốn dành khoảng thời gian trống để chia sẻ các thủ thuật giúp các bạn xây dựng được trang web riêng của mình. Bạn nào cần xây dựng blog, web thì cứ ới, rảnh là mình giúp, tất cả FREE nhé!

Ý kiến cá nhân của bạn

bộ công cụ Wordpress hữu ích dành cho mọi website

Bộ công cụ hữu ích dành cho mọi website Wordpress

Bao gồm theme & plugin tốt nhất và được sử dụng nhiều nhất!

Xin vui lòng kiểm tra email để xác thực tài khoản!