Skip to main content

Ako používať nástroj "Ngram Viewer" v službe Knihy Google

Anonim

Ngram, tiež obyčajne nazývaný N-gram, je štatistická analýza textu alebo reči n (číslo) nejakej položky v texte.

Vyhľadávacia položka môže obsahovať všetky druhy vecí, napríklad fonémy, predpony, frázy alebo písmená. Hoci N-gram je trochu nejasný mimo výskumnej komunity, používa sa v rôznych oblastiach a má veľa dôsledkov pre vývojárov kódujúcich počítačové programy, ktoré chápu a reagujú na prirodzený hovorený jazyk.

V prípade aplikácie Google Books Ngram Viewer sa text, ktorý sa má analyzovať, pochádza z obrovského množstva kníh, ktoré spoločnosť Google naskenovala z verejných knižníc na vyplnenie vyhľadávacieho nástroja služby Knihy Google. V programe Google Books Ngram Viewer odkazujú na text, ktorý hľadáte ako telo , Prehliadač Ngram Viewer sa zhromažďuje podľa jazyka, aj keď môžete samostatne analyzovať britskú a americkú angličtinu alebo ich dať dohromady.

Ako funguje program Ngram

  1. Prejdite do programu Google Books Ngram Viewer na stránke books.google.com/ngrams.

  2. Zadajte akúkoľvek vetu alebo frázu, ktorú chcete analyzovať. Oddeľte každú frázu čiarkou. Google navrhuje, "Albert Einstein, Sherlock Holmes, Frankenstein", aby ste začali. Položky rozlišujú veľké a malé písmená, na rozdiel od vyhľadávania na webe Google.

  3. Zadajte rozsah dátumov. Predvolená hodnota je 1800 až 2000.

  4. Vyberte korpus. Môžete vyhľadávať texty v cudzom jazyku alebo angličtinu a okrem štandardných možností si môžete všimnúť napríklad "Angličtina (2009) alebo Americká angličtina (2009)" v dolnej časti. Jedná sa o staršie korpusy, ktoré spoločnosť Google odvtedy aktualizovala, ale môžete mať nejaký dôvod na porovnanie s starými dátovými súbormi. Väčšina používateľov ich môže ignorovať a zamerať sa na najnovšie korpusy.

  5. Nastavte úroveň vyhladzovania. Vyhlazovanie znamená, ako hladký je graf na konci. Najpresnejšie zastúpenie by malo byť vyrovnávacia úroveň 0, ale toto nastavenie môže byť ťažké čítať. Predvolená hodnota je nastavená na hodnotu 3. Vo väčšine prípadov ju nemusíte upravovať.

  6. Stlačte tlačidlo Hľadať veľa kníh Tlačidlo.

Spoločnosť Google vám umožní s Ngram Viewer trochu vyvrcholiť. Ak by ste chceli vyhľadať ryby, potom sloveso namiesto ryby podstatné meno, môžete to urobiť pomocou značiek. V takom prípade by ste hľadali "fish_VERB"

Spoločnosť Google poskytuje na svojich webových stránkach úplný zoznam príkazov, ktoré môžete použiť, a inú pokročilú dokumentáciu.

Čo je zobrazenie Ngramu?

Nástroj Google Books Ngram Viewer bude zobrazovať graf, ktorý reprezentuje použitie konkrétnej frázy v knihách v čase. Ak ste zadali viac ako jedno slovo alebo frázu, uvidíte farebne označené riadky na kontrast rôznych hľadaných výrazov. To je docela podobné službe Google Trends, iba vyhľadávanie pokrýva dlhšie časové obdobie.

Prípadová štúdia

Zvážte prípadovú štúdiu oštiepkových koláčov. Spomínajú sa v Laure Ingalls Wilderovej Malý dom na prérii series. Ak sa chcete dozvedieť viac o octových koláčkach, zistite, či sú považované za súčasť americkej južnej kuchyne a skutočne sú vyrobené z octu. Očakávajú sa späť do čias, kedy nie všetci mali prístup k čerstvým produktom po celý čas roka. Ale je to celý príbeh?

Vyhľadávanie Google Ngram Viewer pre octový koláč a stretnete sa s niektorými zmienkami o koláčoch v skorých aj neskorých rokoch 20. storočia, veľa sa zmienilo o štyridsiatych rokoch minulého storočia a čoraz viac sa spomína v posledných rokoch. Avšak s úrovňou vyhladzovania 3 uvidíte námestie nad menami v roku 1800. Pretože v tom čase nie sú publikované žiadne množstvo kníh a preto, že naše dáta sú nastavené na hladké, narúšajú obraz. Pravdepodobne tu bola jedna kniha, ktorá spomenula octový koláč, a to sa dostalo priemerne, aby sa zabránilo hrotom. Nastavením vyhladzovania na hodnotu 0 vidíme, že to je presne ten prípad. Špicové stredisko sa datuje do roku 1869 a v roku 1897 a 1900 sa objavil ďalší hrot.

Je nepravdepodobné, že sa o zvyškoch času nikto nehovoril o octoch: Pravdepodobne sa na celom mieste plavali recepty, ale ľudia jednoducho zapísať o nich v knihách a to je dôležité obmedzenie týchto vyhľadávaní Ngram.