Quá trình lựa chọn URL cho một tập hợp nội dung cụ thể. Các trang web hiện đại thường cho phép truy cập nội dung của chúng không chỉ từ một mà là nhiều URL chứa thông tin truy vấn. Quá trình này giúp quản lý URL nào đang được lập chỉ mục và ghi nhận bởi các công cụ tìm kiếm.
Trong SEO, URL Canonicalization xử lý các trang web có nhiều hơn một URL, chỉ một trong số chúng được công nhận là dạng chuẩn của URL. Một ví dụ về một trang web có nhiều hơn một URL sẽ là https://wikipedia.com, https://www.wikipedia.com, https://www.wikipedia.com/, https://www.wikipedia.com/?source=asdf, tất cả các URL này đều trỏ đến cùng một trang web.
Tại sao Canonicalization lại quan trọng?
Nội dung trùng lặp là một chủ đề phức tạp đối với nhiều chủ doanh nghiệp và trang web. Khi các công cụ tìm kiếm thu thập dữ liệu từ nhiều URL khác nhau có nội dung tương tự, điều này sẽ gây ra nhiều vấn đề khiến bạn khó đạt được mục tiêu trực tuyến hơn. Mặc dù bạn có thể không cố ý sao chép các trang nhưng nhiều người không nhận ra rằng có nhiều cách khác nhau để “sao chép” một trang mà không chỉ ăn cắp blog của người khác.
Ví dụ: nếu bạn có nhiều trang vị trí trên trang web được thiết kế để làm nổi bật các dịch vụ của bạn cho mọi người ở những khu vực cụ thể trên thế giới, thì bạn có thể đặt nội dung tương tự trên mỗi trang. Tuy nhiên, điều này có thể dẫn đến nội dung bị đánh dấu là “trùng lặp”. Quá trình chuẩn hóa sẽ cho các công cụ tìm kiếm biết trang nào nên được coi là bản sao chính của trang. Điều này giúp tránh các vấn đề trùng lặp nội dung và cũng dùng để kết hợp tất cả trọng lượng liên kết đến vào một trang. Trong thực tế, chuẩn hóa cho công cụ tìm kiếm biết phiên bản nào của trang sẽ được hiển thị trong kết quả tìm kiếm và bản sao nào của trang sẽ có lưu lượng truy cập được gửi đến trang đó.
Vấn đề trùng lặp nội dung trên trang web của bạn rất phức tạp, nhưng để đơn giản hóa mọi thứ, bạn chỉ cần nhận ra rằng khi các công cụ tìm kiếm thu thập dữ liệu trang web của bạn và có rất nhiều nội dung trùng lặp, chúng có thể bỏ lỡ nội dung gốc của bạn. Ngoài ra, một lượng lớn nội dung trùng lặp có thể làm giảm khả năng xếp hạng của bạn trong kết quả của công cụ tìm kiếm. Việc có nhiều phiên bản của cùng một trang cũng có nguy cơ khiến công cụ tìm kiếm chọn sai phiên bản để sử dụng làm phiên bản chính của trang. Vì vậy, việc chuẩn hóa có thể giúp bạn kiểm soát nội dung trùng lặp của mình.
Hệ thống quản lý nội dung và các trang web điều khiển bằng mã càng làm tăng thêm vấn đề bằng cách thêm các thẻ HTML tự động và các tham số URL khiến bạn có thể có hàng nghìn URL trùng lặp trên trang web của mình mà không nhận ra.
Khi nào cần có URL Canonical?
URL chuẩn hoặc thẻ chuẩn có thể là một cách quan trọng để tổ chức và nâng cao trang web của bạn vì lợi ích của SEO (và khách hàng của bạn). Tuy nhiên, việc xác định thời điểm bạn cần chuẩn hóa nội dung của mình có thể phức tạp, đặc biệt khi bạn có một trang web thương mại điện tử đang phát triển với nhiều trang.
Để giúp bạn hiểu rõ hơn về loại trang web có thể cần liên kết chuẩn, dưới đây là một số ví dụ bên ngoài trang chủ mà bạn có thể cần xem xét:
· URL cho các biến thể sản phẩm: Nếu bạn đang sử dụng các URL khác nhau để xác định các biến thể của cùng một sản phẩm, bạn cần phải chuyển mỗi trang thành một trang chuẩn. Phiên bản chuẩn của trang sẽ thông báo cho công cụ tìm kiếm rằng bạn không "sao chép" nội dung mà đang quảng cáo các phiên bản tương tự của cùng một sản phẩm.
· URL dành riêng cho thiết bị di động: Các trang AMP và miền dành riêng cho thiết bị di động cần có phiên bản chuẩn của riêng chúng. Tạo nội dung được thiết kế cho bối cảnh di động là rất quan trọng, nhưng nếu bạn đang tạo các trang example.com cụ thể cho người dùng di động của mình, bạn cần phải cho Google biết rằng đây là các trang chuẩn chứ không phải trang trùng lặp. Có một ít hướng dẫn hữu ích có sẵn từ Google về cách bạn có thể phân biệt các trang cụ thể cho thiết bị di động.
· Các trang cụ thể theo khu vực: Nếu bạn điều hành doanh nghiệp của mình ở nhiều nơi khác nhau thì bạn muốn trình thu thập thông tin của công cụ tìm kiếm thấy điều đó. Tạo các trang địa phương và khu vực giúp bạn dễ dàng hơn trong phạm vi tìm kiếm địa phương. Tuy nhiên, bạn cần nhớ thêm nội dung chuẩn phù hợp vào các trang này. Đảm bảo rằng các trang theo vùng cụ thể sẽ hướng khách hàng quay lại trang trung tâm nơi nội dung của bạn bắt đầu. Điều này thậm chí còn quan trọng khi bạn tạo các trang sản phẩm địa phương bằng các ngôn ngữ cụ thể bằng bản dịch plugin.
· Nội dung tự tham chiếu: Hầu hết các hệ thống quản lý nội dung hiện nay đều tự động thực hiện việc này, nhưng điều quan trọng là phải ghi nhớ điều này. Khi bạn tạo một trang như một phần của chiến lược tối ưu hóa công cụ tìm kiếm, bạn có thể đặt trang đó làm URL chuẩn. Đây là thứ được gọi là URL chuẩn tự tham chiếu và nó quan trọng đối với việc chuẩn hóa các thuật toán. Tính hữu ích của các thẻ này đã được tranh luận rộng rãi trong quá khứ, nhưng Google đã xác nhận rằng những liên kết này có thể giúp các trang hoạt động tốt hơn.
Cách đặt URL chuẩn cho trang của bạn
Việc đặt URL chuẩn cho trang của bạn lúc đầu có vẻ hơi phức tạp.
Có một số lựa chọn bạn có thể khám phá và mỗi lựa chọn đều có những lợi ích và bất lợi riêng cần xem xét. Hiện tại không có phương pháp nào được coi là “tốt hơn” so với các phương pháp còn lại, vì vậy, việc quyết định phương pháp nào hiệu quả là tùy thuộc vào bạn. Hãy xem xét một số lựa chọn.
Chỉ định tên miền ưa thích của bạn
Một giải pháp phổ biến để tạo URL chuẩn yêu cầu bạn sử dụng Google Search console để chỉ định miền chuẩn. Lợi ích của phương pháp này là thường nhanh chóng và dễ triển khai, lý tưởng cho các trang web có cùng nội dung ở nhiều đường dẫn URL khác nhau.
Ví dụ: nếu bạn có văn phòng chính và văn phòng thương hiệu chia sẻ cùng một trang Giới thiệu về chúng tôi trên hai miền riêng biệt, bạn có thể đặt trang văn phòng chính ban đầu làm biến thể chuẩn của trang văn phòng chi nhánh. Đây là một cách dễ dàng để cải thiện SEO mà không cần phải cải tiến trang web của bạn.
Một vấn đề đối với phương pháp này là khi bạn chỉ định tên miền ưa thích của mình trong Google Tìm kiếm, Google Search Console sẽ chỉ đặt biến thể cho các tìm kiếm trên Google của bạn. Điều này có nghĩa là bạn không có giải pháp cho các công cụ tìm kiếm khác. Bạn cũng cần đảm bảo rằng đường dẫn URL của bạn giống hệt nhau để hoạt động. Vì vậy bạn không thể có /about-us và /about.
Sử dụng rel=”canonical” lựa chọn
Trong số các tùy chọn phổ biến nhất để tạo URL chuẩn hóa cho trang web của bạn là sử dụng thẻ Rel cụ thể. Về cơ bản, điều này có nghĩa là bạn đang đặt siêu dữ liệu vào thẻ tiêu đề của trang HREF và chỉ định URL nào là địa chỉ chính xác.
Bạn thêm thẻ chuẩn vào trong thẻ đầu của trang chứ không phải chính tiêu đề. Lợi ích lớn nhất của chiến lược này là bạn có thể xác định URL chuẩn cho bao nhiêu trang tùy thích và bạn không phải lo lắng về điều đó. http://www đường dẫn noindex cho các trang không chuẩn.
Nhiều hệ thống quản lý nội dung có thể giúp bạn sử dụng giải pháp này và một số thậm chí còn tự động thiết lập và cập nhật thông tin thẻ canonical của bạn. Nhược điểm lớn nhất là việc sử dụng chiến lược này có thể làm tăng kích thước và trọng lượng của các trang của bạn, điều này có thể khiến nội dung của bạn mất nhiều thời gian hơn để tải đối với một số khách hàng.
Một vấn đề khác là nếu CMS của bạn không tự động cập nhật thẻ như đã đề cập ở trên thì thường khó duy trì độ chính xác. Bạn có thể cần kiểm tra xem trang web của mình có được cập nhật thường xuyên hơn không.
Sử dụng tiêu đề Rel=canonical cho HTTP
Đây là một tùy chọn tương tự như tùy chọn được đề cập ở trên. Tuy nhiên, có một sự khác biệt nhỏ. Bạn có thể đặt liên kết chuẩn trong phần tiêu đề HTTP để xác định phiên bản chính xác của nội dung chuẩn của bạn. Đây là một phương pháp tốt nếu bạn có tệp PDF, PHP và nội dung khác trên trang web của mình mà bạn cần xác định chính xác, vì tùy chọn liên kết ở trên sẽ chỉ hoạt động qua HTML.
Tương tự như giải pháp Liên kết, bạn có thể sử dụng tiêu đề chuẩn làm quản trị viên trang web của mình bao nhiêu lần tùy thích. Ngoài ra, vì bạn không tải dữ liệu meta vào trang web WordPress của mình hoặc dữ liệu cho một trang web khác nên các trang sẽ không tải chậm hơn nữa.
Thách thức chính với chiến lược này là nó có thể khó thực hiện đúng hơn một chút so với các phương pháp khác. Nếu bạn chịu trách nhiệm về một trang web lớn và số trang của bạn không ngừng tăng lên thì việc duy trì tất cả các URL chuẩn của bạn thường rất khó khăn.
Lời khuyên hàng đầu cho việc chuẩn hóa
Để tránh trùng lặp với website của mình, bạn cần biết cách điều chỉnh mọi thứ từ URL, (www.example.com), tới các trang khác nhau mà bạn lưu trữ trực tuyến. Sao chép có thể gây ra sự cố nghiêm trọng với tìm kiếm trên Googlebot và có thể khiến bạn xếp hạng thấp hơn một tên miền khác nếu bạn không có chiến lược phù hợp.
Đảm bảo rằng bạn biết cách sử dụng các công cụ phần tử liên kết khác nhau và txt không phải www trong trang web của mình để xác định các trang tương tự là rất quan trọng. Nó thậm chí có thể ảnh hưởng đến hiệu suất của bạn trên Microsoft Bing và giúp các nhà tiếp thị đưa tên của bạn lên đó dễ dàng hơn.
Dưới đây là một số mẹo để giúp bạn:
- Sử dụng các công cụ phù hợp: Nếu bạn lo lắng về việc tìm cách tự mình sử dụng những thứ như XML và TXT thì bạn có thể truy cập các công cụ để trợ giúp. Các giải pháp như Yoast rất tốt để làm cho trang web của bạn thân thiện hơn với SEO. Ngoài ra còn có nhiều giải pháp CMS khác nhau có thể hỗ trợ việc chuẩn hóa.
- Hãy nhớ chuẩn hóa trang chủ: Trang chủ trùng lặp là một số vấn đề phổ biến nhất đối với nhiều quản trị viên web. Nhiều người có thể liên kết đến trang chủ của bạn theo nhiều cách khác nhau mà bạn không thể kiểm soát hoàn toàn. Với ý nghĩ đó, hãy đảm bảo rằng bạn có thẻ chuẩn trên mẫu trang chủ của mình để có thể giảm thiểu sự cố.
- Hãy rõ ràng với các hướng dẫn: Công cụ tìm kiếm là những công cụ tuyệt vời nhưng chúng không hoàn hảo. Nếu bạn gửi các tín hiệu hỗn hợp bằng cách hướng các công cụ tìm kiếm qua lại bằng các thẻ chuẩn được xâu chuỗi, thì bạn có thể gặp rủi ro.
- Nơi-cchết tiệt, thẻ kinh điển năng động. Mã xấu có thể là một vấn đề thực sự đối với quản trị viên web. Nếu nội dung nào đó không được viết đúng cách cho mọi phiên bản URL của bạn thì bạn sẽ gặp vấn đề. Đảm bảo bạn thường xuyên kiểm tra ngẫu nhiên các URL của mình, đặc biệt là trên các trang web CMS và Thương mại điện tử.
- Hãy cẩn thận với các bản sao gần: Thông thường, khi mọi người nghĩ đến việc chuẩn hóa, họ nghĩ đến những bản sao chính xác. Bạn cũng có thể sử dụng thẻ này trên các trang gần như trùng lặp, nhưng bạn nên thận trọng về cách thực hiện. Có rất nhiều tranh luận về chủ đề này và cách bạn nên sử dụng thẻ của mình để tránh mọi vấn đề với công cụ tìm kiếm. Hãy nhớ rằng các thẻ không chuẩn có thể không phù hợp cho mục đích xếp hạng.
- Ghi nhớ các bản sao tên miền chéo: Nếu bạn đang chạy nhiều trang web thì bạn cũng có thể cần phải sử dụng thẻ chuẩn trên các tên miền. Ví dụ: nếu bạn là công ty xuất bản thường xuyên xuất bản cùng một bài viết trên nửa tá trang web, việc sử dụng thẻ chuẩn sẽ tập trung sức mạnh xếp hạng của bạn vào một trang web duy nhất. Tuy nhiên, việc chuẩn hóa sẽ ngăn cản việc xếp hạng các trang web không chuẩn.
Thẻ Canonical khác với chuyển hướng 301 như thế nào?
Cuối cùng, trước khi chúng ta kết thúc định nghĩa về chuẩn hóa này, hãy làm rõ một số điều về chuyển hướng 301. Có rất nhiều điều cần hiểu về URL của bạn, từ việc lấy đúng tệp robots.txt cho mục đích lập bản đồ cho đến việc biết công cụ tìm kiếm nên và không nên lập chỉ mục những gì.
Một lo ngại phổ biến về SEO là thẻ canonical có thể không truyền được vốn liên kết theo cách tương tự như chuyển hướng. Các chuyên gia cho biết đây không phải là vấn đề, vì hầu hết các trang đều truyền được vốn hoặc thẩm quyền. Tuy nhiên, đây có thể là một câu hỏi khó. Hãy nhớ rằng cả hai giải pháp đều tạo ra thông tin rất khác nhau cho khách truy cập trang web và trình thu thập thông tin tìm kiếm.
Ví dụ: nếu bạn sử dụng chuyển hướng 301 để chuyển hướng trang A đến trang B, khách truy cập là con người sẽ không bao giờ nhìn thấy trang A. Tuy nhiên, việc sử dụng chuẩn hóa sẽ hiển thị cho các công cụ tìm kiếm rằng Trang B là trang chuẩn, nhưng khách truy cập của bạn sẽ có thể truy cập cả hai URL .