هشدار گوگل در مورد محتواهای تکراری
جان میوئلر، تحلیلگر گرایشهای گوگل وبمستر، در توییتر خود، یک پیام برای راهنمایی و شفاف سازی درباره سردرگمیهای مشاهده شده در زمینه محتوای تکراری منتشر کرده است.
جان: متوجه شدم درباره ممیزهای موجود در URLها سردرگمیهایی وجود دارد، پس امیدوارم این به شما کمک کند. ممیز برای روت / نام میزبان= اهمیتی ندارد؛ ممیز در جایی دیگر= اهمیت دارد (آنها URLهای متفاوتی هستند)
ممیز گذاشتن برای روت/ نام میزبان
گذاشتن اسلش در روت / نام میزبان اهمیت ندارد. این یعنی چه در پایان نام دامنه خود ممیز بگذارید و چه این کار را انجام ندهید هیچ تفاوتی ایجاد نمیشود. به عبارت دیگر، میتوانید به طور تصادفی هومپیج خود را با آدرسی مانند /www.example.comو www.example.com لینک بزنید و گوگل آن را به عنوان یک محتوای تکراری در نظر نخواهد گرفت.
این یک شفاف سازی بسیار خوب است زیرا دیگر نگران این موضوع نخواهید بود.
ممیز – Forward Slash در پایان فایلها به عنوان کپی محسوب میشود
درک این مورد اهمیت زیادی دارد. نام فایلها با / و بدون آن به عنوان کپی در نظر گرفته میشوند. بنابراین اگر صفحه وب شما از طریق example.com/fish و /example.com/fish قابل دسترسی باشد، با مشکل محتوای کپی یا تکراری مواجه خواهید شد. اگر URL واقعی /fish/ است سرور شما باید /fish را به /fish/ ریدایرکت کند.
مقاله مرتبط: متداولترین اشتباهات در حوزه سئوی فنی و میزان شدت تاثیر آنها
پروتکولهای مختلف دارای اهمیت هستند
در اینجا مسئله محتوای تکراری واقعیت پیدا میکند. جان میوئلر اشاره میکند که اگر یک URL را با یک پروتکول متفاوت بنویسید، گوگل همان صفحه را به عنوان دو صفحه مختلف شناسایی میکند.
برای مثال، https://www.example.com با http://www.example.com متفاوت دیده خواهد شد. تا زمانی که شما ریدایرکتهای 301 را برای کنار آمدن با این موضوع دارید، مشکلی پیش نمیآید. اما اگر ندارید، ممکن است گوگل به این قضیه مانند یک مشکل نگاه کند. و میتواند دردسر ساز شود.
چگونه یک رقیب میتواند گوگل را سردرگم کند
برخی از سرورها، حتی اگر دارای گواهی امنیتی نباشید هنوز صفحه وب را به عنوان HTTPS عرضه میکنند. گوگل به آن مانند یک صفحه وب تکراری نگاه میکند. تنها کار لازم این است که یک رقیب سایت شما را با https لینک بزند، و به این ترتیب باعث میشود صفحه وب تکراری توسط گوگل ایندکس شود.
برخی از سرورها ممکن است اصلا از طریق HTTPS، از صفحه وب بدون SSL پشتیبانی نکنند، اگر هیچ ریدایرکتی برای اداره درخواستهای ورژن HTTPS وجود نداشته باشد و پاسخ سرور شما خطای “site can’t be reached” باشد،یک رقیب میتواند لینکهایی برای ورژن ناموجود HTTPS ایجاد کند، و طبق گفته جان میوئلر شاید گوگل آن را به عنوان یک صفحه مجزا ببیند.
طبق بیانیه جان میوئلر:
“نامهای میزبان و پروتکولهای متفاوت اهمیت زیادی دارند … ”
سپس از این مثال استفاده کرده است:
http://www.example.com/ همانند https://www.example.com/ نیست.
سپس جان میوئلر مثالهای بیشتری برای محتوای تکراری نشان میدهد:
این URL:
همانند این URL نیست:
و این:
مانند این یکی نیست:
تمام مثالهای بالا نمایش دهنده راههایی است که یک رقیب میتواند به سایت شما لینک بزند و چیزی را ایجاد کند که گوگل آن را به عنوان محتوای تکراری ببیند. آیا این محتوای تکراری به رنکینگ شما آسیب میرساند؟ احتمالا نه. به غیر از اینکه این سایت با خطا مواجه میشود، گوگل در تشخیص یکی بودن این دو صفحه و ترکیب آنها عملکرد خوبی دارد. هنوز هم این راه، روش خوبی برای سردرگم نساختن رباتهای جستجو است.
مقاله مرتبط: مقایسه برچسبها و دستهها – بهترین روش برای دستهبندی محتوا در وردپرس از نظر سئو
چطور از سایت خود در برابر شناسایی شدن با عنوان محتوای تکراری محافظت کنیم؟
- Canonical Tag
یک صفحه معیار برای هر صفحه تعریف کنید. این به گوگل میگوید که کدام ورژن از URL، آدرس صحیح شما است. با اینکه گوگل موظف به تبعیت از معیار نیست، از آن به عنوان تاییدیه و کمک استفاده میکند تا URL صحیح را در صفحات نتایج جستجو نمایش دهد.
https://support.google.com/webmasters/answer/139066?hl=en
- امتحان کنید که سرور شما در برابر درخواست URLهای امن و غیرامن چه پاسخی میدهد
شاید نیاز باشد ریدایرکتهای 301 را برای جبران خطاهای URL یا خطای اختلال سایت، اضافه کنید.
- بازبینی URLها
با Screaming Frog(فروشی) یا XENU Link Sleuth(رایگان) صفحه خود را بررسی کرده و از نظر تکراری بودن یا داشتن خطای پیدا نشدن، URLهای خود را مرور کنید.
- بررسی خطاهای 404
لاگهای سرور، تحلیلهای ترافیک یا Google Search Console را چک کنید و منبع هر یک از خطاهای 404 و not found را ردیابی کنید. خطاهای 404 همواره باید مورد بررسی قرار بگیرند.
شفاف سازی جان میوئلر درباره تکراری بودن یا نبودن صفحه از نگاه گوگل دارای اهمیت بسیاری است. وجود یک توضیح رسمی واقعا خوب است. و اگر چه ممکن است شما مشکلاتی پیدا کنید، تا حدودی این اعتماد ایجاد میشود که در اکثر موارد گوگل در تشخیص صفحه اصلی موفق عمل میکند، بنابراین نیازی به وحشت نیست. با این حال، در حوزه سئو هزاران جزئیات کوچک وجود دارد و این مورد تنها یکی از این جزئیات است.