Saltar al contenido

Så här använder du Ngram Viewer Tool i Google Books

3 de agosto de 2021
ngram viewer screenshot 79d5bb8ab1fb4527ab327e4415bcef31

Ett Ngram, även kallat N-gram, är en statistisk analys av text- eller talinnehåll att hitta n (ett nummer) av något slags objekt i texten. Sökobjektet kan vara alla möjliga saker, inklusive fonem, prefix, fraser och bokstäver. Även om ett Ngram är oklart utanför forskarsamhället, används det på en mängd olika områden och har många konsekvenser för utvecklare som kodar datorprogram som förstår och svarar på naturligt talat språk. När det gäller Google Books Ngram Viewer kommer texten som ska analyseras från det stora antalet böcker i det offentliga området som Google skannade för att fylla i sökmotorn för Google Books. För Google Books Ngram Viewer hänvisar Google till texten som du ska söka som korpus. Ngram Viewer aggregerar efter språk, även om du separat kan analysera brittisk och amerikansk engelska eller klumpa ihop dem.

Hur Ngram Viewer fungerar

  1. Gå till Google Books Ngram Viewer på books.google.com/ngrams.

  2. Skriv en eller flera fraser som du vill analysera. Skilj varje fras med ett kommatecken. Google föreslår «Albert Einstein, Sherlock Holmes, Frankenstein» för att komma igång. I NGram Viewer-sökningar är objekt skiftlägeskänsliga, till skillnad från i Googles webbsökningar.

  3. Välj ett datumintervall. Standard är 1800 till 2000.

  4. Välj en korpus. Du kan söka texter i främmande språk eller engelska, och förutom standardvalen kan du lägga märke till poster som «engelska (2009)» eller «amerikansk engelska (2009)» längst ner i listan. Det här är äldre korpor som Google sedan har uppdaterat, men du kan ha någon anledning att göra jämförelser mot gamla datamängder. De flesta användare kan ignorera dem och fokusera på de senaste företagen.

  5. Ställ in utjämningsnivån. Utjämning avser hur smidig grafen är i slutet. Den mest exakta representationen återspeglar en utjämningsnivå på 0, men den inställningen kan vara svårläst. Standardinställningen är 3. I de flesta fall behöver du inte justera den.

  6. Tryck Sök massor av böcker.

Med Googles Ngram Viewer kan du gå in i data. Om du vill söka efter verbet fisk i stället för substantivet fiskkan du göra det med hjälp av taggar. I det här fallet skulle du söka efter fish_VERB.

Google tillhandahåller en komplett lista med kommandon och annan avancerad dokumentation för användning med Ngram Viewer på sin webbplats.

Vad visar Ngram?

Google Books Ngram Viewer matar ut en graf som representerar användningen av en viss fras i böcker genom tiden. Om du har angett mer än ett ord eller en fras representeras var och en av en färgkodad linje som kontrast med de andra söktermerna. Detta liknar Google Trends, bara sökningen täcker en längre period.

Fallstudie

Tänk på fallstudien av vinägerpajer. De nämns i Laura Ingalls Wilder’s Lilla huset på prärien serier. Att utforska med Googles webbsökning för att lära sig mer om vinägerpajer avslöjar att de anses vara en del av amerikanska södra köket och verkligen är gjorda med ättika. De lyssnar tillbaka till tider då inte alla hade tillgång till färskvaror under alla tider på året men är det hela historien? Sök efter Google Ngram Viewer vinägerpaj, och du kommer att stöta på några omnämnanden av pajen både i början och slutet av 1800 -talet, många omnämnanden på 1940 -talet och ett ökande antal omnämnanden på senare tid. Men med en utjämningsnivå på 3 ser du en platå över nämnderna på 1800 -talet. Eftersom det inte var många böcker som publicerades under den tiden och eftersom data är inställda på att jämna ut blir bilden förvrängd. Förmodligen bara en bok nämnde ättika paj, och det var i genomsnitt för att undvika en spik. Genom att ställa in utjämningen till 0 kan du se att detta är exakt fallet. Spiken centrerar sig på 1869, och det finns en annan spik 1897 och 1900. Det är osannolikt att ingen talade om vinägerpajer resten av tiden: Det fanns förmodligen recept överallt, men folk skrev inte om dem i böcker, och det är en viktig begränsning av Ngram -sökningar.