Avancerat sök- och fråtspråk. Sökmotorens språk

datorer

Ett fråge språk är ett konstgjort skapat programmeringsspråk som används för att göra frågor i databaser och informationssystem.

fråge språk

I allmänhet kan sådana sökmetoder varaklassificera beroende på om de används för en databas eller för att söka information. Skillnaden är att förfrågningar på sådana tjänster görs för att få aktuella svar på de ställda frågorna, medan sökmotorn försöker hitta dokument som innehåller information om användarens intresseområde.

databaser

Databasfrågesspråk inkluderar följande exempel:

  • QL - objektorienterad, refererar till relationsdatabaser; efterträdare till datalog.
  • Kontextuell (CQL) är ett formellt fråge språk för informationshämtningssystem (som webbindex eller bibliografiska kataloger).
  • CQLF (CODYASYL) - för databaser för CODASYL-TYPE.
  • Concept-oriented Query Language (COQL) -används i respektive modeller (com). Det bygger på principerna för datamodellering konstruerade och använder sådana operationer som projicering och projicering av multivariat analys, analysoperationer och slutsatser.
  • DMX - används för gruvmodeller.
  • Datalog är ett fråge språk för deduktiva databaser.
  • Gellish engelska är ett språk som kananvänds för frågor i Gellish engelska databaser och möjliggör dialog (förfrågningar och svar), och tjänar även för informationsmodellering av kunskap.
  • HTSQL - översätter http-förfrågningar till SQL.
  • ISBL - används för PRTV (ett av de första relationsdatabashanteringssystemen).
  • LDAP är ett protokoll för frågor och katalogtjänster som körs över TCP / IP.
  • MDX - krävs för OLAP-databaser.

Yandex fråge språk

Sökmotorer

Språket för sökfrågor, i sin tur,syftar till att hitta data i sökmotorer. Det skiljer sig åt eftersom frågorna ofta innehåller vanlig text eller hypertext med ytterligare syntax (till exempel "och" / "eller"). Det skiljer sig avsevärt från standard liknande språk som styrs av strikt kommandosyntax eller innehåller positionsparametrar.

Hur klassificeras sökfrågor?

Det finns tre stora kategorier somtäcka de flesta sökfrågor: informations-, navigations- och transaktionsrelaterade. Fastän denna klassificering inte fixades teoretiskt, bekräftades det empiriskt av närvaron av aktuella frågor i sökmotorer.

Informationsförfrågningar är de somtäcka breda ämnen (till exempel en speciell stad eller lastbilmodell) för vilken tusentals relevanta resultat kan erhållas.

Navigation är en sökning som söker efter en enda webbplats eller en webbsida om ett specifikt ämne (till exempel YouTube).

sök språk

Transaktionellt - speglar användarens avsikt att utföra en viss åtgärd, till exempel att köpa en bil eller boka en biljett.

Sökmotorer stöder ofta den fjärdetyp av förfrågan som används mycket mindre ofta. Dessa är de så kallade anslutningsförfrågningarna, som innehåller en rapport om anslutningen av den indexerade webbgrafiken (antalet länkar till en specifik webbadress, eller hur många sidor som indexeras från en specifik domän).

Hur är sökandet efter information?

De flesta sökmotorer avslöjar inte derassökloggar, så informationen som användare letar efter på webben är mycket svår att hitta. Den första vetenskapliga forskningen framträdde emellertid 1998. Senare genomfördes en andra studie 2001, som analyserade de frågor som visades som mycket relevanta. Det blev också klart hur frågespråket används av sökmotorer.

Intressanta funktioner relaterade till webbsökning blev kända:

Den genomsnittliga sökfrågan var 2,4 ord.

  • Omkring hälften av användarna skickade en förfrågan, och lite mindre än en tredjedel av användarna gjorde tre eller flera unika förfrågningar en efter en.
  • Nästan hälften av användarna såg bara de första eller två sidorna av resultaten.
  • Mindre än 5% av användarna använder avancerade sökfunktioner (till exempel väljer du vissa kategorier eller söker i en sökning).

Anpassade åtgärdsfunktioner

Studien visade också att 19% av ansökningarnainnehöll en geografisk term (till exempel namn, postnummer, geografiska funktioner etc.). Det är också värt att notera att förutom korta frågor (det vill säga med flera villkor) fanns det ofta förutsägbara mönster där användarna ändrade sina sökfraser.

logiskt fråge språk

Det konstaterades också att 33% av ansökningarna frånen användare upprepas, och i 87% av fallen klickar användaren på samma resultat. Detta tyder på att många användare använder upprepade förfrågningar för att granska eller återfå information.

Förfrågningsfrekvensfördelningar

Dessutom bekräftade experter detfrekvensfördelningar av förfrågningar motsvarar en kraftlag. Det vill säga en liten del av sökorden observeras i den största listan av förfrågningar (till exempel mer än 100 miljoner), och de används oftast. De återstående fraserna inom ramen för samma ämnen används mindre och mer individuellt. Detta fenomen kallas Pareto-principen (eller "regel 80-20") och det gjorde det möjligt för sökmotorer att använda optimeringstekniker som indexering eller delning av databasen, caching och prefetching och gjorde det också möjligt att förbättra sökfrågesspråket.

Under de senaste åren har det visat sig att den genomsnittliga längdenFrågor ökar stadigt över tiden. Således har den genomsnittliga frågan på engelska blivit längre. I detta avseende införde Google en uppdatering som heter "Hummingbird" (augusti 2013), som kan hantera långa sökfraser med icke-protokoll, "talat" fråge språk (som "var är närmaste kaffebrygga?").

begäran på engelska

För längre förfrågningar används deras bearbetning - de är uppdelade i fraser formulerade av standardspråket, och svaren på olika delar visas separat.

Strukturerade frågor

Sökmotorer som stöder logisktoperationer och syntax använder mer avancerade fråge språk. En användare som söker efter dokument som täcker flera ämnen eller ansikten kan beskriva var och en av dem enligt en logisk karaktär av ett ord. I kärnan är ett logiskt fråge språk en samling av vissa fraser och skiljetecken.

Vad är en avancerad sökning?

Frågspråk "Yandex" och "Google" kanUtför en mer fokuserad sökning under vissa förutsättningar. Avancerad sökning kan söka efter en del av sidnamnet eller prefixet för titeln, såväl som i vissa kategorier och listor med namn. Det kan också begränsa sökningen efter sidor som innehåller vissa ord i titeln eller finns i vissa ämnesgrupper. Med korrekt användning av frågespråket kan det bearbeta parametrarna en storleksordning som är mer komplex än ytresultatet av att utfärda de flesta sökmotorerna, inklusive användardefinierade ord med variabla avslutningar och liknande stavning. När du presenterar resultaten av en avancerad sökning visas en länk till relevanta delar av sidan.

sökfrågesspråk

Detta är också möjligheten att söka på alla sidor,Innehåller en specifik fras, medan sökmotorerna inte kan sluta på någon diskussionssida med en vanlig fråga. I många fall kan sökfrågan leda till vilken sida som helst i noindex-taggarna.

I vissa fall kan en välformulerad fråga låta dig hitta information som innehåller ett antal specialtecken och bokstäver i andra alfabet (t.ex. kinesiska tecken).

Hur är karaktärerna på frågeformuläret?

Övre och små bok samt någradiakritiska märken (umlauts och accenter) räknas inte i sökningar. Till exempel hittar en sökning med nyckelord Citroen inte sidor som innehåller ordet Citroen. Men vissa ligaturer motsvarar enskilda bokstäver. Till exempel kan en sökning efter ordet "aeroskopning" hitta sidor som innehåller "Ereskebing" (AE = Æ).

Många icke-alfanumeriska tecken är ständigtignoreras. Det är till exempel omöjligt att hitta information om en fråga som innehåller strängen | L | (brevet mellan de två vertikala staplarna), trots att den här symbolen används i vissa konverteringsmallar. I resultaten kommer det bara att finnas data från "LT". Vissa tecken och fraser behandlas annorlunda: Begäran "Credit (Finance)" kommer att visa artiklar med orden "Credit" och "Finance", ignorerar parentes, även om det finns en artikel med exakt namn "Credit (Finance)".

databasfrågesspråk

Det finns många funktioner som kan användas med frågespråket.

syntax

Frågespråk "Yandex" och "Google" kananvänd några skiljetecken för att förfina din sökning. Ett exempel är braces - {{search}}. Uttrycket i dem kommer att sökas helt, oförändrat.

Uttrycket i dubbel citat kan du bestämma dig förföremål för sökning. Exempelvis kommer ordet i citat att erkännas som används i figurativ mening eller som en fiktiv karaktär utan citat - som information av en mer dokumentär natur.

Dessutom stöder alla större sökmotorer symbolen "-" för en logisk "inte", såväl som och / eller. Ett undantag är villkor som inte kan separeras av en bindestreck eller en bindestreck.

Felaktig matchning av sökfrasen är markerad.symbol ~. Om du exempelvis inte kan komma ihåg den exakta ordalydelsen för en term eller ett namn kan du ange det i sökfältet med den angivna symbolen och du kommer att kunna få resultat som har maximal likhet.

Anpassade sökalternativ

Det finns också sökalternativ som intitle,och inkategori. De är kolonfiltrerade filter i form "filter: frågesträng". Fråge-strängen kan innehålla sökord eller fras, eller del eller fullständigt namn på sidan.

Funktion "intitle: fråga "prioriterar sökresultat med namn, men visar också de vanliga resultaten på innehållet i titeln. Flera av dessa filter kan användas samtidigt. Hur använder man denna möjlighet?

Begäran om formuläret "intitle: Flygplatsnamn "visar alla artiklar med flygplatsens namn i titeln. Om vi ​​formulerar det som "parkeringsplats intitle: flygplatsens namn", så får du artiklar med namnet på flygplatsen i titeln och med omnämnande av parkering i texten.

Sök efter filter "inkategori: Kategori "fungerar enligt principen om den första utgåvan av artiklar som tillhör en viss grupp eller en lista med sidor. Till exempel kommer en sökfråga som "Temples Incategory: History" att ge resultat om ämnet templets historia. Denna funktion kan också användas som en förlängd genom att ställa in olika parametrar.