ingwall: (серьёзно)
[personal profile] ingwall
Подумалось вот чего.

Интересно бы сделать в Гугле поиск по категориям - когда точно не знаешь, что ищешь, но знаешь, какого типа результат тебе нужен. Например, нужно мне узнать, каких животных чаще всего зовут Васьками. Иду я в Гугл, задаю поиск на "васька" в категории "животные". Гугл использует заложенный в него список животных, ищет по каждому названию + васька, и выдаёт мне страницу: кот+васька - 3 хита, панголин+васька - 9 хитов, вомбат+васька - 5000 хитов.

Категорий сначала может быть немного- животные-растения-минералы, страны-области-штаты-города, актёры-фильмы-книги, и пр., потом оно может расти, с подкатегориями и так далее. Интересно, насколько это возможно сделать, и пригодилось бы это кому-то ещё, или я один такой извращенец?

Date: 2007-06-19 04:27 pm (UTC)
From: [identity profile] thorion.livejournal.com
Мне кажется, что сама идея такого поиска непоправимо дырява. Ведь полученный тобой результат - это совсем не то, что ты хотел найти. Например, те самые 5000 хитов вомбат+васька могли возникнуть за счет того, что в некоем популярном произведении, которое цитируется на множестве веб-страниц, фигурирует Васька со своим ручным вомбатом.

Date: 2007-06-19 05:35 pm (UTC)
From: [identity profile] ingwall.livejournal.com
Ну, от мусора на выходе не защищён никакой поиск. Я же потом посмотрю, в чём там дело.

Хотя, да, пример про частоту неудачный. Допустим, я помню, что в какой-то статье упоминался зверь Васька, но не помню, какой именно.

Date: 2007-06-19 05:10 pm (UTC)
From: [identity profile] notestaff.livejournal.com
oni vrode pytajutsja ugadat' kategoriju poiska:

>These formulas have grown better at reading the minds of users to interpret a >very short query. Are the users looking for a job, a purchase or a fact? The >formulas can tell that people who type “apples” are likely to be thinking >about fruit, while those who type “Apple” are mulling computers or iPods. They >can even compensate for vaguely worded queries or outright mistakes.
http://www.nytimes.com/2007/06/03/business/yourmoney/03google.html?ei=5070&en=6f2aa34dcb55c85c&ex=1182398400&pagewanted=all

v chastnosti za schjot invasion of your privacy -- using the history of your searches to guess the category of your next search.

byl ran'she search engine Northern Light kotoryj rasfasovyval rezul'taty po kategorijam. no on svernulsja :(

Date: 2007-06-19 05:33 pm (UTC)
From: [identity profile] ingwall.livejournal.com
Слушай, а этим же, по-моему, занимались [livejournal.com profile] debedb и Макс Розеноер в своё время. Когда они работали на mad scientist'а who was sponsored by an excentric millionaire.

Date: 2007-06-19 05:38 pm (UTC)
From: [identity profile] notestaff.livejournal.com
"mozhet li mad scientist sdelat' cheloveka millionerom?.."

tam dejstvitel'no bylo chto-to s kategorijami ponjatij. no chto imenno, po-moemu tak i ne ponjali ni uvazhaemye astgtciv i debedb, ni excentric ex-millionaire, ni still-mad scientist. maybe debedb can fill in :)

Date: 2007-06-19 08:58 pm (UTC)
From: [identity profile] vinnipuh.livejournal.com
As a matter of fact, I used to work for them (NL) :)! Part of my job was "mining" for websites that included content that would "teach" the engine to place certain pages in certain categories...

Date: 2007-06-19 06:05 pm (UTC)
From: [identity profile] simonff.livejournal.com
Народ заинтересовался. Можешь привести серьезные примеры того, что сейчас тебе трудно найти?

Date: 2007-06-20 01:44 am (UTC)
From: [identity profile] marrazm.livejournal.com
я тут спрошу :)

April 2026

S M T W T F S
   1234
567891011
12131415161718
19 202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 2nd, 2026 06:43 am
Powered by Dreamwidth Studios