Canonical Là Gì

     

Canonical Url là gì? Có chức năng gì trong SEO? bài viết này sẽ hướng dẫn chi tiết cách buổi tối ưu hóa thanh link Canonical trong quy trình làm về tối ưu hóa đến website.

Bạn đang xem: Canonical là gì

Thao tác này thuộc team SEO kỹ thuật. Bạn phải can thiệp một chút vào mã nguồn của website. Vị thế, bạn cần có quyền và biết cách sửa code, nếu như không thì yêu cầu phối phù hợp với người tất cả quyền này nhé.


Xuất phạt điểm của khái niệm canonical url (hay thẻ Canonical) là từ vụ việc trùng lặp câu chữ trên website.

Các dụng cụ tìm kiếm và cả người dùng phần lớn không ham mê nội dung tương tự hoặc trùng lặp.

Nhưng thực tiễn là dù mong muốn hay không, thì rất khó loại bỏ hoàn toàn việc những trang (đại diện là Url) bao gồm nội dung trùng nhau. Tất cả khi người dùng không dìm thấy, thì vẫn đang còn những trường thích hợp về khía cạnh kỹ thuật, cùng trong suy nghĩ của Google, website bao hàm trang được coi là trùng nhau. Ví dụ, đa số Url vắt này được xem là bị giống nhau nội dung:

http://www.ten-mien.comhttp://www.ten-mien.com/index.htmlhttps://ten-mien.comhttps://www.ten-mien.com

Tất cả số trên đều là trang chủ của website bao gồm domain là ten-mien.com

Một khi gồm nội dung trùng lặp, website sẽ bị Google trừ điểm, bắt lỗi, thậm chí nghiêm trọng rộng là bị phạt. Vậy rõ ràng, khi chúng ta không nhìn hoặc dấn thấy, thì vấn đề vẫn xảy ra. Với khi đó, để tối ưu web, bạn cần biết cách khắc phục.

Giải pháp là gì?

Bạn cần nhận ra những trường hợp giống nhau (chi tiết ở phần sau), và chọn 1 trang chuẩn nhất trong các trang bị trùng nhau, rồi thông tin Url đó mang đến Google biết.

Với ý kiến đó, giờ đồng hồ tôi ước ao đi cụ thể vào tư tưởng khái niệm…

*

Canonical Url là gì?

Đó là URL của trang chuẩn chỉnh nhất trong những những trang bao gồm nội dung tương tự hoặc giống nhau nhau trên site của bạn. Nói cách khác, trong số những trang trùng lặp, cần phải có 1 trang có tác dụng chuẩn, cùng trang đó mang nội dung nguồn gốc (tạm dịch là Url chuẩn).

Trong ví như trên phần đầu tôi đã minh họa về mặt đường dẫn khác biệt của trang chủ.

Một ví dụ khác, trên website gồm 2 trang về một mặt hàng cụ thể, chỉ khác nhau về một vài ở trong tính (chẳng hạn: màu sắc). Nếu bạn không nêu rõ đâu là URL chuẩn, thì Google đang thay bạn chọn URL chuẩn chỉnh hoặc có thể xem các trang này còn có tầm đặc trưng như nhau. Cả 2 hướng đó đều không có ích cho trang web của bạn.

Nhiều khả năng, bạn nên chủ động thông báo cho Google biết trang nào mới là chính. Lúc đó, bạn phải đặt trực thuộc tính rel="canonical" vào trong thẻ

Cú pháp để Canonical Url:

Cần chú ý rằng, những trang được Google coi là trùng lặp, thì không tốt nhất thiết phải tuyệt đối hoàn hảo giống nhau. Chẳng hạn, khi tất cả thay đổi bé dại trong việc bố trí hoặc lọc list các sản phẩm (theo màu sắc sắc, giá bán cả), thì URL hoàn toàn có thể khác đi, tuy vậy cơ bạn dạng nội dung vẫn vậy, và Google xem số đông trang này là đụng hàng nhau.

Về ngữ nghĩa giờ đồng hồ Anh, bạn dạng thân từ bỏ canonical tức là “kinh điển”, nghĩa là chuẩn chỉnh nhất. Trang nào bao gồm url “kinh điển” thì nó là đúng, là chuẩn, và phần nhiều trang khác tương tự được xem là không chuẩn chỉnh (non-canonical).

Tại sao phải dùng canonical url khi SEO website?

Việc sử dụng Canonical Url đúng chuẩn và đúng theo lý sẽ giúp đỡ xử lý vụ việc bị quy định tìm kiếm đánh lỗi trùng lặp nội dung trên website của bạn.

Bản thân những SE siêu “dị ứng” với câu chữ bị đụng hàng giữa những website, cùng giữa những trang trên cùng website. Trùng lặp gây tốn thời gian và tài nguyên của SE khi bắt buộc craw các trang như thể nhau, đồng thời cũng gây nặng nề chịu cho những người tìm tìm thông tin, lúc vào mấy trang văn bản tương tự.

Do đó, một khi trên website của bạn đã chứng thực trang nào là chuẩn chỉnh trong nhóm trang (mà các bạn thấy) tất cả nội dung bị trùng lặp, thì bạn đã chủ động làm cho quá trình thu thập thông tin của những SE tiện lợi hơn. Điều đó cũng tức là làm mang đến website của đồng bọn thiện rộng với các SE, và cụ thể đã góp thêm phần tối ưu hóa đến website.

Vậy việc áp dụng Canonical Url phải chăng chẳng phải là 1 trong những việc khi có tác dụng SEO là gì?!

Ghi chú: việc xử lý trùng lặp ngôn từ trên website cần được phối kết hợp thêm giữa nội dung nguồn gốc với những công gắng khác như: chuyển hướng 301, Robots.txt, thông báo Google gỡ bỏ Url (Google URL Removal), nằm trong tính "noindex" giỏi "nofollow".

Tối ưu hóa Canonical Url cụ nào?

Việc này khá solo giản. Bạn chỉ cần chọn trang làm sao là chuẩn, rồi đặt trong thẻ loại mã sau:

Nhớ gắng đoạn /url-chuan/ bằng Url chuẩn chỉnh và khá đầy đủ nhé.

Vậy còn biện pháp kiểm tra coi 1 trang đã buổi tối ưu về canonical url hay chưa, thì làm như vậy nào? có 3 yếu đuối tố bạn phải audit:

Trang này đã có thẻ canonical chưa? bao gồm rồi là được. Dùng cách thức như Moz, SEOquake...Thẻ canonical đang trỏ đúng đến trang chuẩn chỉnh hay chưa? chúng ta phải tự đánh giá yếu tố này.Những trang này còn có được lập chỉ mục tuyệt không? soát sổ trên Google với cú pháp site:url

Nếu thiếu nguyên tố nào, bạn cần bổ sung hoặc chỉnh sửa yếu tố đó cho đảm bảo an toàn tính về tối ưu khi có tác dụng SEO.

Những ngôi trường hợp trùng lặp - đề xuất dùng Canonical Url

Để biết cách bao giờ dùng ở trong tính canonical, thì trước hết cần xem bao giờ thì các trang được xem như là trùng lặp nhau. Dưới đấy là những vẻ bên ngoài trùng lặp thông dụng nhất nhưng mà tôi thấy được.

Phiên phiên bản "www" và không "www" + phiên bạn dạng "http" cùng "https"

Thường thấy tốt nhất là khác nhau về thương hiệu miền phụ www cùng giao thức https. Hoặc cùng với website gồm phiên bản máy tính và phiên bản di động riêng.

Xem thêm: Portfolio Design Là Gì ? Tổng Hợp Các Mẫu Portfolio Đẹp Nhất

Chẳng hạn với trang web thanhphodong.vn của mình ở đây, thì tối thiểu 4 url bên dưới đây đều có cùng nội dung, cùng được coi là trùng lặp.

http://thanhphodong.vnhttps://thanhphodong.vnhttp://www.thanhphodong.vnhttps://www.thanhphodong.vn

Trong trường hợp này, tôi chỉ mang lại Google 1 Url chuẩn, bằng cách đưa vào thẻ đoạn lệnh sau:

Ngoài ra, cần áp dụng một vài chuyên môn khác liên quan đến Điều phía 301 nhằm trỏ hết các phiên phiên bản trên về Url sử dụng https và không có www. Với website của bạn, còn nếu như không biết giải pháp thực hiện, bạn cần nhờ sự trợ giúp nhân viên lập trình web.

Phiên bạn dạng URL tất cả và không có dấu gạch chéo ở cuối cùng

Đây cũng là trường hợp phổ biến, khi cùng 1 trang nhưng có 2 phương án: bao gồm hoặc không có dấu gạch chéo cánh ở phần cuối của URL.

Chẳng hạn, chúng ta vào cả 2 Url dưới đây, thì đều hoạt động (nghĩa là bị trùng lặp):

https://www.vietnamairlines.com/vn/vi/home/https://www.vietnamairlines.com/vn/vi/home

Có điệu độc đáo là vào code không chỉ có rõ Canonical Url.

Phiên phiên bản máy tính và di động

Như trang báo Dân trí, gồm 2 phiên phiên bản riêng cùng với 2 Url núm này:

https://dantri.com.vn/https://m.dantri.com.vn/

2 trang này câu chữ giống nhau gần như là hoàn toàn. Vày đó, vào Source Code của họ cũng có thể có dòng chỉ rõ đâu là Url chuẩn:

Bộ thanh lọc và sắp xếp (Filter & Sorting)

Việc thực hiện công cụ bộ lọc hoặc sắp xếp thường gây nên sự trùng lặp. Đơn giản bởi vì những tác vụ này tạo ra Url khác nhau, nhưng nội dung không cụ đổi.

Ví dụ, với trang web sàn giao dịch thanh toán ô sơn bonbanh.com. Đây là trang danh sách các xe Audi đang được chào bán:

https://bonbanh.com/oto/audi

Khi thu xếp theo năm thêm vào (mới/cũ), giá bán xe (cao/thấp), thì cũng được 4 trang khác:

https://bonbanh.com/oto/audi-sf000000010https://bonbanh.com/oto/audi-sf000000020https://bonbanh.com/oto/audi-sf000000030https://bonbanh.com/oto/audi-sf000000040

Rõ ràng, cả 5 trang trên mọi cùng câu chữ (các xe cộ Audi trên sàn giao dịch), chỉ được thu xếp theo vật dụng tự khác nhau. Số đông trang này được coi là trùng lặp nội dung, cần trong code yêu cầu chỉ rõ 1 URL chuẩn. Và đây là hiệu quả tôi tra cứu thấy trong code của họ:

Trang search kiếm nội bộ

Chẳng hạn, vào kiếm tìm kiếm câu chữ trên trang luatvietnam.vn với những các từ không giống nhau:

https://luatvietnam.vn/tim-van-ban.html?Keywords=abchttps://luatvietnam.vn/tim-van-ban.html?Keywords=xyz

Cùng 1 trang, tra cứu kiếm trường đoản cú khóa khác nhau thì cho Url không giống nhau. Vì chưng vậy, cũng bị coi là trùng lặp. Và với trường đúng theo này vào mã website này đã và đang chỉ rõ nội dung nguồn gốc để Google biết đâu là chuẩn:

Trang đích trỏ tới từ là 1 trang link (Referral Link)

Trong tiếp thị liên kết, các bạn thường đặt links từ trang của mình đến trang đích. Khi bạn dùng bấm vào vào links đó, vẫn dẫn cho tới trang đích gồm tham số giới thiệu. Về thực chất đây vẫn chính là trang cũ, nhưng biến đổi Url, và vị đó cũng trở nên lỗi trùng lặp.

Ví dụ: 2 url dưới đây cùng 1 trang, nhưng không giống nhau về ID của người làm tiếp thị links (đoạn ?coupon=VNL01 ở cuối cùng):

https://unica.vn/bat-dau-lam-xuat-nhap-khau-tu-con-so-0https://unica.vn/bat-dau-lam-xuat-nhap-khau-tu-con-so-0?coupon=VNL01

Và ví dụ Unica đã chứng tỏ về Url chuẩn chỉnh trong code:

Ngoài những trường phù hợp nêu trên, còn 1 số trường thích hợp khác về sự việc cố trùng lặp, chẳng hạn như: phiên bản cho vật dụng in, ID phiên (Session)... Nhưng bởi ít gặp, buộc phải tôi không nêu chi tiết tại đây.

Trùng lặp chéo giữa các tên miền

Nghĩa là chúng ta có 2 hoặc nhiều website mang tên miền không giống nhau, nhưng gồm có trang lại đụng hàng nội dung. Như vậy, để tránh bị tiến công lỗi, bạn cũng cần được chỉ rõ trang nào trên domain name nào là chuẩn, đều trang đụng hàng chỉ là bản sao và yêu cầu trỏ về trang chuẩn đó.

Chẳng hạn, chúng ta có hệ thống vài trang web trong hệ thống vệ tinh (PBN). Lúc viết 1 bài bác mới bạn đăng tải tất cả những site này. Vậy thì, nhằm Google không bắt lỗi trùng nội dung, bạn cần lựa chọn một Url trên 1 site như thế nào đó làm cho chuẩn, rồi trỏ nội dung nguồn gốc trên toàn bộ các trang tê về trang chuẩn chỉnh đó.

Cách này sẽ giải quyết vấn đề bị tóm gọn lỗi trùng lặp chéo giữa các tên miền (cùng sở hữu).

Phân biệt điều hướng 301 và Canonical Url

Điều phía 301 auto chuyển người dùng từ 1 trang A sang trọng trang một trang B (có Url khác). Và cũng đồng thời thông tin cho những công nỗ lực tìm tìm rằng Url trang A đã hết ở phía trên nữa cùng nó đã chuyển sang một Url mới, với rằng SE hãy dừng lập chỉ mục Url cũ, mặt khác chuyển ảnh hưởng (cả lành mạnh và tích cực và tiêu cực) sang Url mới.

Canonical Url không chuyển người dùng sang trang khác, mà chỉ thông báo (ngầm) đến SE hiểu được Url của trang làm sao là chuẩn trong số những trang giống nhau nhau. Thực tế, khi sử dụng Canonical Url, người dùng thấy cả các trang (không hề bị chuyển làn đường đi). Bởi vì đó người tiêu dùng thường không nhận thấy được về Canonical Url, trừ lúc chứng kiến tận mắt mã code.

Những lỗi cần tránh khi dùng thẻ Canonical Url

Đặt sai vị trí vào vào thẻ . đề nghị đặt Url chuẩn chỉnh trong thẻ , càng sát phần phía bên trên càng gồm lợi. Nếu bạn đặt trong thì Google bỏ qua mất do đó không tồn tại tác dụng.Thông báo tạo lẫn lộn, khi ấy công nuốm tìm kiếm rất có thể bỏ qua hoặc gọi không chính xác thẻ này. Ví dụ, bạn trỏ trang chuẩn từ trang A => trang B, rồi lại từ B => A (hoặc điều phối 301 từ bỏ B lịch sự A). Xuất xắc trường hòa hợp trỏ Url chuẩn kiểu vòng vo giữa nhiều trang, tự A => B => C => D. Gần như trường đúng theo này hồ hết gây khó khăn hiểu, và bạn nên tránh. Bắt buộc đưa thông điệp rõ ràng: trang làm sao là chuẩn.Url tương đối thay vày tuyệt đối. Nghĩa là buộc phải có đường truyền đầy đủ, chẳng hạn như https://tenmien.com/bai-viet/, chứ không cần được nhập hình dáng này: /bai-viet/Sử dụng nhầm cho các trang tất cả phân trang (pagination). Lấy ví dụ như trang blog (liệt kê nhiều bài bác viết) hoặc trang danh mục thành phầm (liệt kê những sản phẩm), chúng ta không nên có thể định Canonical Url. Thực ra, lúc ấy nội dung trên những trang không giống nhau khá nhiều, bạn tránh việc dùng nội dung nguồn gốc để kiêng bị loại bỏ trang không được lập chỉ mục. Nạm vào đó, bạn nên sử dụng tính năng phân trang với trực thuộc tính rel = “next” với rel = “prev”.Trỏ nội dung nguồn gốc trên bản mobile riêng (dạng m.yourdomain.com). Giải pháp làm và đúng là phải trỏ Url gốc về bản desktop, còn từ phiên bản desktop khai báo thêm mang lại mobile bởi thuộc tính “alternate”)Quên không sửa http thành https trong Url chuẩn. Khi thiết lập xong chuyển hướng tự động từ giao thức http thanh lịch https xong, chúng ta nhớ update trong Url sang dạng https.

Một vài xem xét khi thực hiện Canonical Url

Kể cả bạn thông tin Url chuẩn, và hình thức tìm kiếm (SE) review cao bài toán đó, thì SE không có nghĩa vụ cần dùng Url chuẩn đó. Những SE gồm thuật toán riêng biệt để tiến công giá, và vì vậy vẫn rất có thể tự quyết định đâu new là Url chuẩn chỉnh trong số phần đông trang được xem là trùng lặp nội dung.Chỉ nên thực hiện thuộc tính rel="canonical" này khi 2 hoặc nhiều trang gồm một lượng câu chữ bị đụng hàng là đáng kể. Giả dụ trùng ít, thì không nên thông báo, còn nếu như không thì vô hình chung các bạn đã làm tiêu tốn lãng phí nguồn lực lúc khai báo 1 trang có Url phụ, và không được “tính” vào kho dữ liệu của bạn.Một số trường hợp phải dùng chuyển làn đường Redirect 301 thay bởi vì chỉ định Url chuẩn. Tiêu biểu là đối với các phiên bạn dạng có www và không tồn tại www, tốt giao thức http và https mà tôi đã trình bày trong phần trên.

Kết luận

Tìm hiểu canonical url là gì cũng như tác dụng của nó là các bước cần thiết khi làm cho SEO website. Bạn cần biết bao giờ thì yêu cầu áp dụng, với dùng cụ nào mang đến đúng. Đồng thời cũng cần chú ý tránh số đông lỗi dễ dàng mắc phải khi dùng Url chuẩn chỉnh để về tối ưu website.

Đến trên đây tôi xin xong xuôi bài viết.

Xem thêm: Bộ Thu Citrix Là Gì ? Định Nghĩa Citrix Server Là Gì

Còn bạn, kinh nghiệm của bạn về mảng này nỗ lực nào? Bạn áp dụng Canonical Url cho website của chính mình đấy chứ? Có gặp khó khăn gì không? Hãy cùng share nhé.