URL Canonicalization là gì và cách sử dụng Tag Canonical

Google chắc chắn không phải là công cụ tìm kiếm đầu tiên có trên Internet. Tuy nhiên, Google đã làm mọi thứ tốt nhất và cung cấp kết quả thực sự hữu ích cho mọi người. Google đã và đang không ngừng mở rộng kể từ ngày đó. Bạn đã bao giờ gặp phải tình trạng 2 URL cùng hiển thị một nội dung chưa, hoặc nghe đến khái niệm URL Canonicalization.

Mặc dù SEO đều có ảnh hưởng cho tất cả các công cụ tìm kiếm tồn tại ngày nay, nhưng một công cụ tìm kiếm chủ yếu mà mọi người vẫn truy vấn hàng ngày trên Internet là Google. Bất cứ khi nào chúng ta nói về SEO, người ta tự hiểu rằng chúng ta đang nói về việc tối ưu hóa các trang web cho Google.

Khi nói đến SEO, chúng ta cần phải xem xét đến nhiều yếu tố, cả On-Page và Off-Page. Nhưng nếu SEO onsite không hiệu quả thì cho dù bạn có làm SEO offsite tốt đến thế nào thì bạn cũng sẽ không có được kết quả mong muốn.

Nếu bạn là một người mới làm quen với SEO thì đây là một số bài viết gợi ý cho bạn:

Tôi đã kiểm tra một trong những website đang tối ưu SEO , và thấy rằng trang web có một số vấn đề nghiêm trọng liên quan đến Canonicalization. Tôi đã sửa các vấn đề ngay lập tức nhưng cũng quyết định sẽ viết bài để giải thích URL Canonicalization nghĩa là gì và cách sử dụng đúng cách Canonicalization cho một website.

URL Canonicalization là gì?

Thuật ngữ Canonicalization có thể hơi khó hiểu. Hãy để tôi giải thích điều này một cách đơn giản nhất có thể.

Giả sử có hai URL của một trang web:

http://tenmien.com
http://www.tenmien.com

Cả hai đều hiển thị nội dung, và không cái nào trong số 2 trang chuyển hướng đến bất kỳ trang nào trong số chúng. Điều này dẫn đến vấn đề trùng lặp nội dung trên Google, và bạn sẽ bị phạt vì lí do này.

Chúng ta hãy xem một ví dụ nữa. Có hai URL trên một trang web đều cho ra kết quả là một trang web giống nhau.

http://tenmien.org
http://tenmien.org/index.php

Nếu cả hai trang web hiển thị các kết quả tương tự, thì điều này cũng sẽ gây ra vấn đề !

Bạn có thể không quan tâm nhiều đến vấn đề này, nhưng điều này sẽ khiến bạn bị phạt do lỗi trùng lặp nội dung nghiêm trọng. Vấn đề của các công cụ tìm kiếm là chúng không thể xác định phiên bản nào của URL nên thêm vào chỉ mục(index) . Nếu hai trang đều hiển thị một nội dung , chúng sẽ chỉ giả định rằng một bản chính và bản sao của trang còn lại và website sẽ bị phạt.

Nếu trang web được mở trên 2 URL hiển thị nội dung tương tự, thì bạn sẽ phải sửa nó. Bạn phải sử dụng các thiết lập máy chủ để cho dù người dùng có mở bằng www hoặc không có www, trang web sẽ đều hiển thị cùng một nội dung. Bằng cách này, bạn sẽ sửa chữa URL canonicalization.

Mặc dù, có những lúc bạn muốn chia sẻ cùng một nội dung trên hai URL, thì bạn hãy sử dụng các thẻ rel = “canonical” để công cụ tìm kiếm biết rằng đâu là bản gốc và đâu là bản sao của nó. Điều này sẽ giúp không bị phạt lỗi trùng lặp nội dung.

Làm thế nào để sử dụng URL Canonicalization đúng cách?

Bây giờ hãy xem sử dụng URL Canonicalization. Chúng ta không cần phải các đoạn code để làm điều đó. Một tag đơn giản rel = “canonical” là đủ để áp dụng Canonicalization.

URL Canonicalization

URL Canonicalization là gì và cách thực hiện nó đúng cách?

Lấy một ví dụ, có hai URL trên trang web cho ra kết quả với cùng một nội dung . Hai URL đó là:

http://tenmien.org
http://tenmien.org/index.php

HTML Canonicalization

Kết quả URL thứ hai có cùng một nội dung như URL đầu tiên. Cả hai đều hiển thị cùng một trang và do đó bạn có thể áp dụng rel = “canonical”, trong trường hợp này, để chỉ ra rằng URL thứ 2 với index.php là một URL Canonical của cái đầu tiên.

Đây là cách áp dụng nó.

<Link rel = 'canonical' href = 'http://thewebpage.org/index.php'>

HTTP Header Canonicalization

Cách trên được sử dụng với nội dung HTML, thế còn khi chúng ta dùng nội dung không ở dạng HTML như một tập tài liệu PDF thì sao? Trong trường hợp đó, chúng ta nên sử dụng HTTP Header Canonicalization.

> HTTP / 1.1 200 OK
 > Content-Type: application / pdf
 > Link: <http://www.example.com/white-paper.html>; rel = "canonical"
 > Content-Length: 785.710

Bạn hãy tìm thêm thông tin về Canonicalization dựa trên HTTP Header trên Google’s official Webmaster blog.

Khi bạn nên sử dụng Canonicalization?

Bây giờ bạn biết chính xác Canonicalization là gì, vấn đề tiếp theo là khi nào bạn nên sử dụng nó. Bởi vì có rất nhiều trường hợp khác ngoài hai cái tôi đã đề cập trong các ví dụ trên.

Dưới đây là một vài trường hợp sử dụng URL Canonicalization thích hợp.

  • URL khác nhau cho một nội dung tương tự
  • Nhiều loại thư mục và thẻ khác nhau cho ra kết quả với cùng một nội dung
  • Các trang web di động hiển thị cùng một nội dung nhưng trên URL / sub-domain khác nhau
  • URL có dạng HTTP và các HTTPS URL và cho ra kết quả với cùng một nội dung
  • Các port khác nhau
  • Khi trang web có một phiên bản www và một phiên bản không-www
  • Trong trường hợp chia sẻ nội dung syndicated

Đây là một số trường hợp chúng ta áp dụng URL Canonicalization để cứu trang web của mình khỏi bất cứ lỗi phạt trùng lặp nội dung nào.

Vậy khi nào bạn không nên thực hiện URL Canonicalization!

Có những lúc chúng ta không nên thực hiện URL Canonicalization, và trong đoạn này của bài viết sẽ hướng tới việc xác định các điều kiện cụ thể. Bạn cũng hãy coi những cái này là lỗi khi nói đến URL Canonicalization. Hãy để tôi liệt kê chúng từng cái một. Tôi sẽ cố gắng giải thích chúng một cách đơn giản.

Bỏ qua pagination canonicalization

Nếu bạn đang có ý định canonicalize paginated URLs, thì bạn nên biết rằng đây là một ý tưởng không được khôn ngoan. Bạn không nên thêm một thẻ canonicalization vào trang thứ hai của một URL bởi URL đó sẽ không được index bởi Google.

Nhiều thẻ Canonical là không tốt

Nếu một trang web có quá nhiều thẻ rel = “canonical” thì điều đó có thể không tốt. Chọn một thẻ cụ thể mà bạn thích và khiến nó trở nên rõ ràng.

Đừng thêm thẻ Canonical lên các URL bị rút gọn

Tôi đã thấy nhiều người sử dụng thẻ Canonical như thế này:

<Link rel = "canonical" href = "index.php">

Với cách sử dụng canonicalization này sẽ gây ra rất nhiều lỗi. Bạn cần phải hiểu rằng các canonical markup càng hoàn chỉnh thì càng tốt cho nội dung .

<Link rel = "canonical" href = "http://thewebpage.org/index.php">

Khi áp dụng canonicalization thì tốt hơn hết là nên markup theo cách trên.

Không áp dụng canonicalization cho localization  #SEO #Google

Localization  có nghĩa là nhắm mục tiêu và thao tác các nội dung của trang web để phục vụ nó ở một số vị trí địa lý mà bạn nhắm đến(ví dụ: như: Việt Nam hoặc Mỹ). Nếu bạn thực sự muốn tạo ra một trang web tốt hơn cho khán giả trên toàn cầu, bạn hãy đọc hướng dẫn này để tạo ra các trang web đa ngôn ngữ bởi Google.

Canonicalization trên phiên bản di động của trang web

Chỉ cần một thẻ canonical để phân biệt một trang web di động trên sub-domain của trang web chính là không đủ. Google đề nghị bạn sử dụng cả rel = “alternate” cũng như rel = “canonical” để ngụ ý rằng URL đang hiển thị trên phiên bản di động của website.

Đây là cách bạn có thể thực hiện nó:

> <html>
  > <head>
  > <link rel=”canonical” href=”http://tenmien/” >
  > <link rel=”alternate” href=”http://m.tenmien.com/” media=”only screen and (max-width: 640px)”>
  > </head>
  > <body>

Không sử dụng thẻ Canonical ngoài <head>

Các bot tìm kiếm sẽ hoàn toàn bỏ qua các thẻ được thiết lập bên ngoài <head> của trang web để áp dụng một thẻ canonical thích hợp, bạn cần phải thêm nó vào giữa thẻ <head> </ head>.

Không sử dụng nhiều thẻ Canonical trên một trang web

Sử dụng nhiều thẻ Canonical là vô nghĩa. Công cụ tìm kiếm sẽ bỏ qua các thẻ và bạn sẽ phải đối mặt với vấn đề về SEO.

Đừng chỉ URL Canonical tới một trang web với một non-200 status code

Một trang web với một mã như 301 và 302 sẽ buộc các công cụ tìm kiếm crawl thêm một URL và điều này có nghĩa là chúng cần phải crawl hai url cùng lúc. Điều này sẽ gia tăng với số lượng lớn và sẽ ảnh hưởng đến crawl budget .

Thật lãng phí khi crawl một URL với code status là 404 và các bộ máy tìm kiếm sẽ từ chối thẻ tag .

Không sử dụng Canonicalization cho PageRank Sculpting

PageRank vẫn được xem xét bởi các công cụ tìm kiếm. Nếu bạn đang có ý định sử dụng thẻ Canonical cho PageRank sculpting và mong có thứ hạng cao hơn, thì nó sẽ chỉ làm hại trang web của bạn mà thôi.

Lời cuối cùng

Các khái niệm về SEO onsite rộng lớn hơn những gì bạn có thể tưởng tượng. Bạn cần phải làm nhiều việc cùng một lúc, nào là onpage, offpage, chuẩn Seo và bạn cũng phải luôn cập nhật các thay đổi diễn ra hàng ngày

Bài này là một bài cho thấy cách để áp dụng các URL Canonical trên một trang web. Hãy nhớ rằng Canonicalization là một yếu tố quan trọng và nếu bị thực hiện sai cách, nó sẽ gây tổn hại cho website. Luôn kiểm tra website và đảm bảo rằng bạn thực hiện URL Canonicalization đúng cách.

Nếu bạn thấy bài viết này hữu ích hãy Share nó với mọi người nhé. Hoặc hãy theo dõi kênh Yotube của chúng tôi để xem thêm nhiều hướng dẫn về WordPress

Về tác giả

Duy Anh

Chào các bạn,

Mình là coder, đang sống và làm việc ở Mỹ. Mình thích viết lách nên muốn dành khoảng thời gian trống để chia sẻ các thủ thuật giúp các bạn xây dựng được trang web riêng của mình. Bạn nào cần xây dựng blog, web thì cứ ới, rảnh là mình giúp, tất cả FREE nhé!

Ý kiến cá nhân của bạn

bộ công cụ Wordpress hữu ích dành cho mọi website

Bộ công cụ hữu ích dành cho mọi website Wordpress

Bao gồm theme & plugin tốt nhất và được sử dụng nhiều nhất!

Xin vui lòng kiểm tra email để xác thực tài khoản!