Semalt: Porozumění grafu znalostí Google a jeho fungování



Abychom společnosti Google usnadnili pochopení vašeho webového obsahu, je důležité, abychom porozuměli tomu, jak ovlivňovat témata ve znalostním grafu. Semalt je web věnovaný poskytování nejlepších služeb pro své klienty, což znamená porozumět všemu, co souvisí se SEO. Jako společnost, která se zaměřuje na webový design a vývoj webových stránek, začleňujeme SEO do všech aspektů webových stránek. Samozřejmě to zahrnovalo pochopení grafů znalostí Google.

Čím jsou grafy znalostí speciální?

Bez znalostního grafu by pro vyhledávač, zejména Google, bylo obtížné použít strukturovaná data pro entity. Značky a sémantická data zase pomáhají propojovat nápady a koncepty, což usnadňuje jejich transformaci na strukturovaná data, která můžeme použít k vyplnění nebo ovlivnění grafu znalostí Google.

Jako SEO profesionálové je naší povinností porozumět způsobům, jak můžeme ovlivnit tato témata v grafu, abychom mohli ovlivnit smysluplné změny v chápání jejich obsahu společností Google.

Jako odborníci na SEO rozumíme tomu, jak ovlivnit témata v grafu, abychom ovlivnili smysluplné změny v chápání obsahu našich klientů společností Google.

Co je Google Knowledge Graph?

Znalostní grafy považujeme za průnik mezi databází a encyklopedií. Vývojáři odkazují na každý článek v grafu znalostí jako Entita nebo téma v článcích společnosti Google zaměřených na zákazníky.

Entita může být absolutně cokoli. Stejně jako většina databází má svůj jedinečný identifikátor, který se někdy zobrazuje v adresách URL Google. Vypadá to takto: [kgmid=/ g/11f0vfyswk & hl], název parametru „kgmid“ se však může změnit v závislosti na typu entity.

Obvykle existuje několik prohlášení o entitě:
  • Název nebo jméno (například „George Bush“).
  • Typ nebo typy (například „osoba“).
  • Popis (jako „kdysi byl prezidentem Spojených států“).
  • Seznam adres URL obrázků (obvykle spojených s právy na užívání).
  • Podrobný popis (vysvětlující text s adresou URL zdroje).
Google však uvádí, že zatímco informace ve výše uvedeném seznamu mohou být k dispozici přímo v jejich vyhledávacím rozhraní API, tato data jsou interně značně rozšířena.

Ve výše uvedeném příkladu tedy mohou data zahrnovat i datum, kdy se Bush narodil a zemřel; to může zahrnovat, že byl ženatý s Barbarou Bushovou. Může se zmínit o některých jeho úspěších v kanceláři atd.

Se všemi poskytnutými informacemi je snazší zjistit, jak ve srovnání s encyklopedickým článkem není velký rozdíl. Rozdíl však spočívá v tom, že protože jsou všechna fakta rozdělena do kategorií, jako je „Počet let v kanceláři“, je pro stroje snazší spojovat body mezi tématy. Stroje také snáze získávají správné informace téměř okamžitě, když osoba požádá. Například pokud hledáte, kdo byl ženatý s Georgem Bushem? Měli byste vidět toto:


Nejednoznačnost

Po celém světě existuje mnoho znalostních grafů a znalostní graf Google je jen jedním z těchto mnoha grafů. Mezi další znalostní grafy patří Wikidata.org, dbpedia.com a další. Ve skutečnosti lze jakoukoli formu dat, která je částečně strukturovaná, popsat jako znalostní graf, a proto se databáze jako IMDB nebo encyklopedie označují jako znalostní grafy.

Zpočátku Google sestavil svůj graf znalostí z jiných datových sad, včetně CIA Factbook a Wikipedia. Také jsme slyšeli zvěsti, že znalostní panel Google může také fungovat jako jeho znalostní graf. To je však nesprávné a nemělo by se na něj brát ohled. Zatímco panel znalostí někdy představuje podmnožinu dat v grafu, nejsou to samé.

Panel znalostí může také fungovat jako vizuální reprezentace datových položek připojených prostřednictvím grafu znalostí Google. Graf znalostí společnosti Google je však méně vizuálním záznamem o tématech.

Posledním bodem, který se snažíme disambiguovat, je samotná terminologie. Graf znalostí klíčových slov se obecně skládá z entit nebo témat. Z důvodu srozumitelnosti jsme si všimli, že Google upřednostňuje používání výrazu „témata“, protože je to termín, který ve své veřejné dokumentaci používají neustále.

Téma má tendenci být uživatelsky přívětivější, ale také ztížilo pochopení, když Google odkazuje na témata nebo entity.

Typy témat entit

Entitám se obecně zadávají typy témat. Může to být člověk; Událost; Organizace, místo nebo země. Pokud entita není žádnou z nich, je označena jako „věc“. Doufejme, že Google bude i nadále vyvíjet nové typy záznamů, takže budeme používat věci méně často. Rozhraní API pro zpracování přirozeného jazyka používané společností Google poskytuje důležité vodítka, která nás vedou k zamyšlení, zda se skutečně používá mnoho typů témat. Na stránce vývojáře rozhraní API pro vyhledávání znalostí Google Graph se však nachází několik dalších typů entit. V současné době se zdá, že Google není schopen kategorizovat tolik entit, kolik uvedl. Doufáme, že se to postupem času změní.

Kromě toho je pouze asi 20% entit rozpoznáno algoritmem zpracování přirozeného jazyka, který používá Google, ve srovnání s jejich veřejnou nabídkou.

Výhody znalostního grafu

Díky uspořádání světových informací do témat bude snazší procházet a indexovat webové stránky a weby, které vyhledávače využívají. Patří mezi ně rozmanitost, rozsah, integrita a rychlost.

Výhody škálování

Počet webových stránek na internetu je velmi diskutabilní téma. I když někteří mohou namítnout, že jich je nespočet, počet webových stránek s největší pravděpodobností klesá na biliony a toto číslo se každým dnem neustále rozšiřuje. Naproti tomu počet témat, kterým my lidé rozumíme, je podstatně menší a počet roste mnohem nižším tempem.

To naznačuje nadměrnou duplikaci stejných myšlenek sdílených napříč několika obsahy, které najdete na internetu. Tříděním podrobností tématu pomocí polostrukturovaného systému mohou informace obsažené na internetu zabírat menší prostor a nebudou se tolik duplikovat.

Výhody odlišného zdroje dat

Uložením informací o tématu je citování více zdrojů dat mnohem jednodušší a vy už nemusíte znovu odesílat uživatele na stejnou webovou stránku. To nám říká, že Google může a může shromažďovat hlavní podrobnosti o tématech a nechat je zobrazovat pomocí obrazovky nebo několika dalších médií, ale vylepšeným způsobem pro dotaz uživatele nebo uživatele.

Teoreticky mohou být informace o tématu někdy odvozeny ze zdrojů mimo internet.

Výhoda integrity informací

I když je známo, že Google Knowledge Graph obsahuje chyby a věcné nepřesnosti, někdy jej manipulují špatní herci nebo SEO profesionálové. Výhodou tohoto přístupu je, že poskytuje společnosti Google jediný bod pravdy. To však nemusí být případ kontroverzních témat.

Než bude možné přidat do znalostního grafu Google novou skutečnost týkající se jakéhokoli tématu, musí projít několika ověřovacími procesy. Je však nepravděpodobné, že Google bude o těchto prahových hodnotách otevřeně diskutovat.

Negativní stránkou je, že jeden bod pravdy může být náchylný ke zkreslení nebo ke snížení rozmanitosti informací, pokud jsou již samotné zdroje dat znehodnoceny.

Výhody získávání informací

Díky třídění informací podle jejich témat se získávání informací stalo mnohem rychlejším jak Googlem, tak uživateli, kteří mohou hledat jehlu informací v kupce sena webových stránek.

Kde se používá graf znalostí společnosti Google?

U mnoha uživatelů Androidu a chytrých telefonů se znalostní graf nejčastěji používá pro funkci „objevování“ na jejich domovských obrazovkách. Google používá informace o chování uživatele k tomu, aby pochopil, která témata jsou pro vás nejdůležitější, a může pomoci uživatelům najít tato související témata na základě jejich historie používání.

Trendy Google jsou také dalším místem, kde uživatelé mohou najít zajímavá témata. Od tohoto okamžiku může Google poskytnout informace o tom, která témata spolu úzce souvisejí. Současné důkazy však naznačují, že tato data jsou aktuálně shromažďována tahem za další vyhledávání od stejného uživatele, což může vést k vyskakování neočekávaných souvisejících témat.

Stejně jako u panelu, i když uživatel zadá vyhledávací dotaz, na který lze odpovědět pomocí znalostního grafu, získáte také vysoce kvalitní výsledky vyhledávání. Tyto výsledky často zastiňují základní výsledky vyhledávání, což nakonec vede k tomu, že odkazy na webové stránky budou otcové.

Tyto odpovědi se také zobrazují způsobem, který Google může použít k poskytnutí odpovědí uživatelům, kteří používají hlasové vyhledávání.

Závěr

Témata jsou velmi dobře viditelná při vyhledávání obrázků, takže můžete najít relevantní informace z vyhledávání pomocí obrázku relevantního místa nebo osoby.

Toto je vynikající příklad způsobů, jakými se znalostní grafy používají jako úložiště pro jiné zdroje dat kromě webových stránek.