На 15 и 16 юни 2023 се проведе годишната конференция MnSearch Summit в Минесота, САЩ.
Ето част от най-интересните новости, които бяха представени.
Детайли от презентацията на Майк Кинг:
- Проучванията показват, че Google индексира 0,03 % от интернет. Според тях 60% от уебсайтовете са дублирани. Следователно много уебсайтове просто не се индексират. Понастоящем Google е много строг по отношение на индексирането и това ще се влоши с генеративния изкуствен интелект.
- От Google казват, че нямат бюджет за обхождане, но гледат търсенето на обхождане: ако дадена страница е по-ценна, те ще я обхождат по-често. Вътрешните връзки са много важни.
- XML картите на сайта имат отделна система за обхождане. Google също така търси диференцирани ситемапи – малки ситемапи, които се актуализират често.
- Google може да спре обхождането въз основа на модели на URL адреси. Ето защо е толкова важно да предоставяте това, което е ценно и да не индексирате съдържание, което не е полезно.
- Повечето сайтове не използват последователно сигналите от Schema или LastMod, за да сигнализират за промени. Google гледа колко често дадена страница се е променяла в миналото и въз основа на това определя честотата на обхождане.
- От началото на 2000 г. съществува правило, според което търсачките проникват само на 5 нива в дълбочина. Но това правило вече е остаряло, тъй като инфраструктурата за търсене е станала много по-стабилна.
- Google не преминава от страница на страница или не обхожда от връзка на връзка. Той просто събира списък с URL адреси и ги поставя на опашка. Google не зарежда страницата и не обхожда всяка връзка, а определя приоритетите въз основа на това, което смята за по-важно.
- При обхождането няма състояния – обхождащата програма не съхранява бисквитки или други състояния. Всяко зареждане на страница се третира така, сякаш това е първото зареждане.
- Всички инструменти за SEO все още се придържат към лексикалния модел. Всъщност целият SEO софтуер, който използвате, е остарял с 10 години.
- Плътно търсене – Google вече може да разбере коя част от страницата ви е релевантна на заявката. Така те могат да правят неща като подчертаване на фрагменти в богати фрагменти (rich snippets).
- Релевантността е функция на косинусовото сходство. Това е количествена мярка, а не качествена, както обикновено мислят/казват специалистите по SEO.
- Google превръща уебсайтовете във вектори. Те имат вектори и за авторите. Google може да разбере релевантността и от двете страни на дадена връзка.
- Word2Vec се провали, защото улавяше връзките между думите, но не и контекста. BERT подобри W2V, като взе предвид контекста.
- TF-IDF е рядък вектор: той не отразява толкова много информация, а само наличието или отсъствието на думи. Word2Vec ни даде плътни вектори, които разглеждат термините по-подробно.
Начинът, по който конструирате изреченията, може да се използва, за да се подобри или потвърди разбирането на Google за даден обект. Когато видят последователни атрибути за назовани същности, те ще вземат предвид това в своето разбиране за същността.
Ето и част от презентацията на Макс Прайн:
- Google обикновено не взема предвид каноничните тагове. Ако синдикирате съдържанието си на трети страни, положението е още по-лошо, защото ако третата страна има по-голям авторитет, Google вероятно ще игнорира каноничния таг.
- Ако имате повече от 1 хил. ситемапа в GSC, няма да получите данни за тях – GSC ще предостави информация само за най-старите 1000.
- Когато разглеждате данните на CrUX, те са обобщени по посещения на сайта. Когато разглеждате отчетите на GSC, те са обобщени по страници. Google групира и екстраполира тези обобщени данни.
- Не забравяйте, че процентите на CWV и Page Experience в GSC са % страници, а не % трафик. Ако имате голям % страници с малък % трафик, тези цифри може да не отразяват действителния опит на потребителите.
Част от най-интересните слайдове
Оценете ни
Your page rank: