Nieprzyjazne URL-e indexowane przez google bota.
Strona 1 z 2 12 OstatniOstatni
Wyniki 1 do 10 z 18

Temat: Nieprzyjazne URL-e indexowane przez google bota.

  1. #1
    Przeglądacz
    Dołączył
    15-04-2010
    Wpisy
    39
    Punkty
    6

    Joomla! 3.5 Nieprzyjazne URL-e indexowane przez google bota.

    Oparłem stronę na schemacie przypisywania pozycji menu do każdego artykułu. Chciałem miec możliwośc przypisania szablonu do widoku otwartego artykułu i przypisania dowolnego modułu do dowolnego artykułu.
    Dzięki temu tez mogłem zastosować proste URL bez info o kategorii czy ID artykułu np www strona pl /jakis-tam-tytul-artykulu wszystko było ok, google indexowało chętnie takie proste url, lecz wczoraj zauważyłem, że zamiast takeigo ładnego url zaindeksowało cos takiego: www strona pl /component /content / article?id=25:jakis-tytul-jakiegos-artykulu zamiast prostego url. Skąd to się wzięło i co zrobić, żeby ukryć to dla wyszukiwarek, żeby widziały tylko ładne proste url ustalone dzieki przypisaniu pozycji. Dodam jeszcze że gdy otwiera się przy takim url nie ma juz przypisanego szablonu. Prosze o pomoc

  2. Pani Reklamowa
    Pani Reklamowa jest aktywna
    Avatar Panny Google

    Dołączył
    19-08-2010
    Skąd
    Internet
    Postów
    milion
    Pochwał
    setki
  3. #2
    Przeglądacz
    Dołączył
    15-04-2010
    Wpisy
    39
    Punkty
    6

    Domyślny

    ...znalazłem przed chwilą w logach serwera, że google bot miał problem z odnalezieniem robot.txt - umieściłem go w złym miejscu. Poczekam na wizytę bota, i jeśli się potwierdzi, że to było przyczyną wrócę zamknąć temat.

  4. #3
    Przeglądacz
    Dołączył
    15-04-2010
    Wpisy
    39
    Punkty
    6

    Domyślny

    Przed chwilą sprawdziłem logi serwera, google bot przeleciał przez url i wyniki są juz git. Podstawa problemu to błąd z robots.txt albo błędna lokalizacja albo inny problem zwiazany z blednymi wytycznymi w samym pliku ( najlepiej nie kombinować, użyć stockowy plik z joomla - wystarczy zapisac z koncowka txt i wszystko). Gdy już jednak problem sie pojawi to nr 1 - poprawić błędy z robots.txt, sprawdzic w google search console czy nie ma problemow. nastepnie w google search console w parametrach url wpisac parametr component ( lub inny wystepujacy w niechcianym url ) i ustawic jako zaweza - nie wyswietlac usunac z wynikow. Nastepnie zabieg, aby przyspieszyc ponowna indexacje przez bota - usunac w tym samym narzędziu niechciany URL ( tam jest taka funkcja usun tymczasowo z wynikow, wbijamy url ktorego nie chcemy widziec w wynikach google ). Dla swietego spokoju zgłosiłem jeszcze pownowna indexacje do google ale wydaje mi sie, że to miało najmniejsze znaczenie w przyspieszeniu procesu ponownej wizyty bota w tym obszarze. Bądźcie mądrzy, nie popełniajcie cudzych błędów. Pozdro!

  5. #4
    Przeglądacz
    Dołączył
    15-04-2010
    Wpisy
    39
    Punkty
    6

    Domyślny

    Odświeżam temat, google nadal indexuje url-e z parametrami: www.strona.pl/component/content/article?id=5:tytul-artykulu, indexuje również wersje www.strona.pl/tytuł-artykułu ale chciałbym aby w indexach były tylko pożądane odnośniki. Czy ktos z was ma na to sposób?
    mój plik robots.txt wyglada tak:

    Kod:
    User-agent: *
    Disallow: /administrator/
    Disallow: /bin/
    Disallow: /cache/
    Disallow: /cli/
    Disallow: /component/
    Disallow: /components/
    Disallow: /includes/
    Disallow: /installation/
    Disallow: /language/
    Disallow: /layouts/
    Disallow: /libraries/
    Disallow: /logs/
    Disallow: /modules/
    Disallow: /plugins/
    Disallow: /tmp/
    
    Sitemap: https://strona.pl/sitemap.xml


    Dodam, że w google search console zablokowane sa parametry w url-ach typu id i nadal nic, tzn indexuje takie kwiatki:
    www.strona.pl/component/content/article?id=5:tytul-artykulu

  6. #5
    Wiarus Jac awatar
    Dołączył
    22-12-2005
    Skąd
    Szczecin/Warszawa/Bieszczady
    Wpisy
    1 321
    Punkty
    182

    Domyślny

    Dodaj w robots.txt

    Kod:
    Disallow: /component/content/article?id=5:tytul-artykulu
    Noindex: /component/content/article?id=5:tytul-artykulu
    Tylko musisz doczytać, co Google na stosowanie Noindex w pliku robots.txt. Nie jestem teraz pewien, czy bierze to pod uwagę, czy nie.

    Trochę lektury:

    http://tools.seobook.com/robots-txt/
    https://moz.com/learn/seo/robotstxt
    Zapracowany po uszy, cały czas kilka projektów na tapecie.
    Od 2005 roku indywidualne projekty Joomla - www.studioalfa.pl.
    Polecam darmowe templatki Joomla.

    Nie pomagam w kwestiach związanych z Joomla na Facebooku! Forum Joomla jest tutaj.

  7. #6
    Przeglądacz
    Dołączył
    15-04-2010
    Wpisy
    39
    Punkty
    6

    Domyślny

    Dodaj w robots.txt

    Kod:
    Disallow: /component/content/article?id=5:tytul-artykulu
    Noindex: /component/content/article?id=5:tytul-artykulu

    Tylko musisz doczytać, co Google na stosowanie Noindex w pliku robots.txt. Nie jestem teraz pewien, czy bierze to pod uwagę, czy nie.
    To każdy artykuł musiałbym w ten sposób blokować, musi być inne wyjście

  8. #7
    Wyga Jola awatar
    Dołączył
    08-01-2008
    Skąd
    Wrocław
    Wpisy
    3 239
    Punkty
    386

    Domyślny

    Powodem powstawania takich adresów jest brak Itemid w linku.
    Tego typu linki mogą być generowane przez różne rozszerzenia, często moduły.
    Na tym forum ten temat był wielokrotnie poruszany.

  9. #8
    Przeglądacz
    Dołączył
    15-04-2010
    Wpisy
    39
    Punkty
    6

    Domyślny

    Powodem powstawania takich adresów jest brak Itemid w linku.
    Tego typu linki mogą być generowane przez różne rozszerzenia, często moduły.
    Na tym forum ten temat był wielokrotnie poruszany.
    Dzięki za odpowiedź. Znalazłem wpis na ten temat na forum, odnośnie Itemid. Jednak dotyczy on starej wersji Joomla, sugestie ustawień jakie tam podano nie istnieją w 3.6.5. Ponad to nie wiem czy to istotne, ale wszystkie artykuły są podpięte pod osobne "niewidoczne" menu ( w celu podpinania dowolnych modułów i szablonów do różnych artykułów ).

  10. #9
    Przeglądacz
    Dołączył
    15-04-2010
    Wpisy
    39
    Punkty
    6

    Domyślny

    witam,
    Dziękuję za sugestie sprawdzenia forum w poszukiwaniu wielokrotnie poruszanego tematu. Owszem temat poruszany, lecz w żadnym wątku NIE BYŁ rozwiązany.
    linki z /component/content/ w indexie google nie mają nic wspólnego z robots.txt, itemid, podwójnymi linkami, strukturą menu, kategorii czy innymi głupotami sugerowanymi przez nawet najlepszych na tym forum. Powód indexowania takich linków przez google jest banalny, chętnie pomogę na priv, pozdrawiam.

  11. #10
    Wiarus Jac awatar
    Dołączył
    22-12-2005
    Skąd
    Szczecin/Warszawa/Bieszczady
    Wpisy
    1 321
    Punkty
    182

    Domyślny

    @cubase, chyba nie czytałeś ze zrozumieniem. Podałem Tobie sposób na zablokowanie tego typu linków, żeby nie indeksowały się w Google.

    Skoro twoim zdaniem problem indeksowania tego typu adresów URL jest banalny i znasz rzekome rozwiązanie, to podziel się tym na publicznym forum, a nie robisz teraz z tego tajemnicę.
    Zapracowany po uszy, cały czas kilka projektów na tapecie.
    Od 2005 roku indywidualne projekty Joomla - www.studioalfa.pl.
    Polecam darmowe templatki Joomla.

    Nie pomagam w kwestiach związanych z Joomla na Facebooku! Forum Joomla jest tutaj.

Strona 1 z 2 12 OstatniOstatni

Podobne tematy

  1. Odpowiedzi: 0
    Ostatni post/autor: 11-08-2016, 17:24
  2. Wyświetlanie adresu URL w Google
    przez Konar na forum Optymalizacja, wydajność
    Odpowiedzi: 1
    Ostatni post/autor: 24-06-2013, 20:42
  3. Odpowiedzi: 1
    Ostatni post/autor: 25-11-2011, 09:50
  4. dziwna indexacja linkow wg google bota
    przez mami na forum Wydajność, optymalizacja
    Odpowiedzi: 5
    Ostatni post/autor: 28-02-2011, 20:36
  5. Jak dodać film przez url
    przez dzidek99 na forum Administracja składnikami
    Odpowiedzi: 0
    Ostatni post/autor: 22-08-2009, 19:58

Reguły pisania

  • Nie możesz zakładać nowych tematów
  • Nie możesz dodawać wypowiedzi
  • Nie możesz dodawać załączników
  • Nie możesz poprawiać swoich postów
  •