Найзручніший пошуковик. Як шукати інформацію в інтернеті, які бувають пошукові системи. Відеоогляд анонімних пошукових систем

У мережі не тільки шукати, але і знаходити потрібну інформацію досить просто. Що робити, якщо Вам потрібно знайти рецепт лимонного пирога або пам'ятка міста, який Ви хочете відвідати? На допомогу нам летять пошукові системи.

Пошукова система- це сайт, який дозволяє користувачам шукати інформацію по введеному запиту на існуючих веб-сторінках в інтернеті.

Коли «павук» будує свої списків, процес називається веб-скануванням. Щоб створювати і підтримувати корисний список слів, «павуки» пошукової системи повинні дивитися на безліч сторінок. Як будь-який «павук» починає свої подорожі в Інтернеті? Відправними точками є звичайні списки дуже використовуваних серверів і дуже популярні сторінки. «Павук» почнеться з популярного веб-сайту, індексуючи слова на ваших сторінках і слідуючи кожному посиланні, знайденої на сайті.

У документі, який описує, як була побудована система, Сергій Брін і Лоуренс Пейдж наводять приклад того, як швидко їх павуки можуть працювати. Вони побудували свою первісну систему, щоб використовувати кілька павуків, зазвичай три одночасно. Кожен павук міг одночасно підтримувати близько 300 з'єднань з відкритими сторінками. При максимальній продуктивності, використовуючи чотири павука, його система могла сканувати більше 100 сторінок в секунду, генеруючи близько 600 кілобайт даних в секунду.

Зазвичай пошукова система складається з одного, але найважливішого елемента - пошукового рядка, порівняйте декілька сайтів:



Які бувають пошукові системи і чим вони відрізняються

Велика розмаїтість зарубіжних і вітчизняних, гігантських і маленьких, хороших і так собі. Вони відрізняються один від одного алгоритмом роботи і областю всесвітньої павутини, В якій шукають. Російські звертають увагу на, в якій знаходиться сайт (доменна зона пишеться після назви сайту через точку: «.ru» - якщо в Росії або «.ua» - якщо в Україні і т.д.) і шукають тільки в Росії і країнах колишнього радянського союзу,світові ж пошукові системи шукають всюди.

Зберігання всього, що працює швидко, означало створення системи для подачі інформації, необхідної для павуків. Слова на сторінці Де були знайдені слова. . Слова, які зустрічаються в заголовку, короткий зміст, метатегах і інших позиціях відносної важливості, були відзначені для особливого розгляду під час подальшого пошуку користувача. У інших павуків різні підходи. Ці різні підходи зазвичай намагаються змусити павук працювати швидше, дозволяючи користувачам шукати більш ефективно, або і те, і інше.

Наприклад, деякі павуки відстежуватимуть слова в заголовку, субтитрах і засланнях, а також 100 найбільш часто використовуваних слів на сторінці і кожне слово в перших 20 рядках тексту. Привід до цілісності в цьому підході супроводжується іншими системами в зверненні до невидимої частини веб-сторінки, метатегах.

В даний час існують два абсолютних лідера - «Яндекс» і «Google» ( «Гугл»). У світі пошукових систем «Google» займає чітке перше місце, 46% користувачів інтернету в усьому світі вибирає його, проте в Росії його популярність дещо менше, він на другому місці після «Яндекса».

«Гугл» настільки міцно закріпив свою позицію, що в реальному житті з'явилася фраза «google it» або по-російськи «загугли», вона вимовляється, коли потрібно відіслати незнаючого людини вивчати інформацію в мережі

Детальніше про метатегах читайте на наступній сторінці. Метатеги дозволяють власнику сторінки вказувати ключові словаі концепції, в яких сторінка буде проіндексована. Це може бути корисно, особливо в тих випадках, коли слова на сторінці можуть мати подвійні або потрійні значення - метатеги можуть визначати пошукову систему при виборі того, яке з кількох можливих значень для цих слів є правильним. Однак існує небезпека надмірної залежності від метатег, тому що недбалий або недобросовісний власник сторінки може додавати метатеги, які вписуються в дуже популярні теми, але не мають ніякого відношення до фактичного вмісту сторінки.


Проте, існують і інші пошукові системи, перерахуємо основні

Три світові лідери:

Гугл - http://www.google.com/ - 46.2%
Яху - http://www.yahoo.com/ - 22.5%
МСН - http://search.msn.com/ - 12.6%

Три російські лідери (без урахування другого місця, яке зайняв «Google» c 26%):

Яндекс - http://www.yandex.ru/ - 45,7%
Рамблер - http://www.rambler.ru/ - 15,1%
Мейл.ру - http://www.mail.ru/ - 6.6%

Щоб уникнути цього, павуки зіставляють метатеги з вмістом сторінки, відхиляючи метатеги, які не відповідають словами на сторінці. Все це передбачає, що власник сторінки насправді хоче, щоб вона включалася в результати діяльності пошукової системи. Найчастіше власник сторінки не хоче з'являтися на пошуковій системі або не хоче, щоб активність павука потрапляла на сторінку. Розглянемо, наприклад, гру, яка будує нові сторінки, активна кожен раз, коли Ви можете бачити розділи сторінки або використовуються нові посилання.

Як користуватися пошуковими системами?

Перш за все, пам'ятайте, що зараз майже всі за замовчуванням використовують певну пошукову систему і дозволяють шукати запит відразу ж у адресному рядкусамої програми. В браузері Google Chrome (Гугл Хром) за замовчуванням варто пошукова система «Google» (зрозуміло, адже, обидва продукти належать одній з найбільших корпорацій, що розробляє найважливіші складові для роботи в інтернеті).

Якщо веб-павук звертається до однієї з цих сторінок і починає стежити за всіма посиланнями на нові сторінки, гра може заплутати діяльність високошвидкісного людини і вийти з-під контролю. Щоб уникнути подібних ситуацій, Був розроблений протокол виключення роботів. Цей протокол, реалізований в розділі метатега на початку веб-сторінки, вказує павук не індексувати сторінку автоматично - НЕ індексувати слова на сторінці і не намагатися відслідковувати її посилання.

Які існують російськомовні пошукові системи

Як тільки павуки завершили завдання пошуку інформації на веб-сторінках, пошуковій системі необхідно зберегти інформацію таким чином, щоб вона була корисною. Для збору зібраних даних доступні два основних компоненти. Інформація, що зберігається з даними Метод, за яким індексується інформація. . Фактично, це зробило б двигун обмеженим використанням, оскільки не було б способу визначити, чи використовувалася слово на важливому або тривіальний шляху на сторінці, чи використовувалася слово один або багато разів або якщо на сторінці містилися посилання на інші сторінки, що містять слово.

Після натискання на enter з'явиться вікно з результатами, які вдають із себе перелік сайтів, що містять дану фразу. На нашому конкретному прикладі, видача результатів буде такою:


Нам залишається лише перейти по одній з посилань, щоб почитати, що це таке. Якщо ми шукаємо, як ця глазовиколупивательніца виглядає, то натискаємо зверху вкладку «Картинки» і отримуємо цілий набір картинок з цією назвою.

Іншими словами, не було б ніякого способу створити список ранжирування, який намагається представити найбільш корисні сторінки у верхній частині списку результатів пошуку. Двигун може зберігати кількість разів, коли слово відображається на сторінці. Двигун може привласнювати вагу кожного запису, збільшуючи значення, призначені словами, які з'являються у верхній частині документа, підзаголовки, посилання, метатеги або заголовок сторінки. Кожна комерційна пошукова система має іншу формулу для призначення ваги словами в своєму індексі.

Так само можна переходити безпосередньо на сам сайт системи і шукати вже там. А який конкретно сайт вибрати - вирішувати Вам.

Основні помилки при пошуку

Головне, пам'ятати про те, що пошукова система не володіє людським розумом і питати її в тій формі, в якій зазвичай запитуємо людини - немає сенсу. Типовий приклад - запити з серії «де мені знайти Васю Петренко в інтернеті?», Така постановка в корені некоректна.

Як видалити інформацію про себе з пошукової системи?

Це одна з причин того, що пошук одного і того ж слова в різних пошукових системах буде виробляти різні списки зі сторінками, представленими в різних замовленнях. Незалежно від точної комбінації елементів додаткової інформації, Що зберігається в пошуковій системі, дані будуть закодовані для економії місця для зберігання. Кожен фактор може приймати до 2 або 3 біт в двобайтового угрупованню. В результаті великий обсяг інформації може зберігатися в дуже компактній формі. Після стиснення інформації він готовий до індексування.

Пошукова система шукає на існуючих сайтах конкретні фрази, Які ви задаєте.

Тобто вона не думає і не аналізує зміст написаного, а всього лише шукає сайт і статті, що містять введене Вами назва (не рахуючи різних математичних операцій: спробуйте в гуглі знайти, скільки буде 6 + 8-5.)

Індекс має одну мету: він дозволяє знайти інформацію якомога швидше. Існує кілька способів побудови індексу, але одним з найбільш ефективних способівє створення хеш-таблиці. У хешування застосовується формула для додавання числового значення до кожного слова. Формула призначена для рівномірного розподілу записів через задану кількість поділів. Це числове розподіл відрізняється від розподілу слів в алфавіті, що є ключем до ефективності хеш-таблиці.

На англійській мові є кілька листів, які починають багато слів, в той час як інші починають менше. Це нерівність означає, що пошук слова, що починається з дуже «популярного» листи, може зайняти набагато більше часу, ніж знайти слово, яке починається з менш популярного слова. Хеш вирівнює різницю і зменшує середній час, необхідний для пошуку запису. Він також відокремлює індекс від ефективного введення. Хеш-таблиця містить хеш-номер разом з драйвером для фактичних даних, який може бути відсортований в будь-якому випадку, дозволяючи йому зберігати більш ефективно.

Повертаючись до нашого запиту про Васю: коректно було б писати основну думку, головну суть пошуку, тобто «Вася Петренко», а не те, де його можна знайти. Але таких Вась Петренко мільйон, тому потрібні різні доповнюють слова, але не «Вася Петренко зі шрамом на правому вусі, братуха мій», а, наприклад «Вася Петренко фотограф Москва».

Комбінація ефективної індексації та ефективного зберігання дозволяє швидко отримувати результати, навіть коли користувач створює складний пошук. Пошук за індексом передбачає, що користувач повинен побудувати запит і відправити його через пошукову систему. Запит може бути досить простим, одним словом, як мінімум. Для побудови більш складного запиту потрібне використання булевих операторів, які дозволяють вам уточнювати і розширювати умови пошуку.

Найбільш часто спостерігаються булеві оператори. Слова в лапках розглядаються як фраза, і фраза повинна бути знайдена в документі або файлі. Ціни котирування знаки. . Це може бути проблемою, коли слова, які ви вводите, мають кілька значень. «Ліжко», наприклад, може бути місцем для сну, місцем посадки квітів, місцем для зберігання вантажівки або місцем, де риба кладе яйця. Якщо вас цікавить тільки одне з цих значень, ви можете не захотіти бачити сторінки, наділені усіма іншими. Ви можете побудувати літеральний пошук, який намагається усунути небажані значення, але це добре, якщо сама пошукова система може допомогти.

Нехай Вас не вводить в оману поява тонни сайтів з готовими рецептами, після пошуку «що приготувати на вечерю», система не зрозуміла суть Ваших бажань, вона просто знайшла сайти з таким твердженням.

Сподіваємося, що Ви освоїли тему і тепер з упевненістю можете розповідати і іншим, як шукати інформацію в інтернеті. А поки потренируйтесь, спробуйте знайти відповіді на питання:

Одна з пошукових областей пошукових систем заснована на пошуку по поняттю. Частина цього дослідження включає використання статистичного аналізу на сторінках, що містять слова або фрази, які ви шукаєте, щоб знайти інші сторінки, які можуть вас зацікавити. Очевидно, що інформація, що зберігається на кожній сторінці, більше для пошукової системи, заснованої на концепції, і для кожного пошуку потрібно набагато більше обробки. Проте, багато груп працюють над поліпшенням результатів і продуктивності цього типу пошукової системи.

  1. Скільки часу в токіо?
  2. Чому небо блакитне?
  3. Скільки папуг в удаві?
  4. Чим харчуються комарі в лісі?

Інтернет необхідний багатьом користувачам для того, щоб отримувати відповіді на запити (питання), які вони вводять.

Інші перейшли в іншу область досліджень, яка називається запитами природною мовою. Ідея запитів на природну мову полягає в тому, що ви можете вводити питання так само, як ви хотіли б запитати людину, що сидить поруч з вами, - немає необхідності відстежувати логічні оператори або складні структури запитів. Він працює тільки з простими запитами; але конкуренція важка для розробки механізму запитів на природну мову, який може прийняти запит з великою складністю.

Огляд ключових сервісів

Причина цього процесу - допомогти користувачеві в його майбутніх дослідженнях і запропонувати речі, які можуть його зацікавити. Цей збір даних може здатися нешкідливим, якщо ми хочемо запропонувати цільові оголошення, інформацію, близьку до наших центрів інтересів.

Якби не було пошукових систем, користувачам довелося б самостійно шукати потрібні сайти, запам'ятовувати їх, записувати. У багатьох випадках знайти «вручну» щось підходяще було б вельми складно, а часто і просто неможливо.

За нас всю цю рутинну роботу з пошуку, зберігання і сортування інформації на сайтах роблять пошуковики.

До російськомовним відносяться

Користувач думає, що він може вибирати, в той час як результати його досліджень поступово орієнтовані - навіть якщо це означає знищення інших. Користувач думає про те, щоб відкрити світу Інтернет, відкривати нові речі, в той час як на практиці пошукові системи блокують його в своєму власному світі, повертаючи його до своїх звичок.

Це не движок але це не є гарантією від відстеження. Користувач може дуже добре зловити «куки», відвідавши сайт, отриманий за результатами його досліджень. «Ви повинні перевиховувати користувача для Інтернету, без демонстрації інструменту», - говорить Жан-Марк Ван Гисемхем. В даний час пошукові системи Інтернету не дозволяють цього. Звідси вся зацікавленість вчитися знати альтернативних операторів, приборкувати їх і дотримуватися їх.

Пошукові системи в Інтернеті російською

1) Почнемо з вітчизняної пошукової системи. Яндекс працює не тільки в Росії, але також працює в Білорусії та Казахстані, в Україні, в Туреччині. Також є Яндекс англійською мовою.

2) Пошуковик Google прийшов до нас з Америки, має російськомовну локалізацію:

3) Вітчизняний пошуковик Майл ру, який одночасно представляє соціальну мережуВКонтакте, Однокласники, також Мій світ, відомі Відповіді Mail.ru і інші проекти.

Деякі альтернативні пошукові системи

Тьєррі Де СМЕД: «В ідеалі це кооперативна модель»

Іноді повільний, він відображає дуже релевантні результати. . Навіть якщо пошукова система в Інтернеті є етичну, необхідно залишатися критичною. Тьєррі Де СМЕД: Важко сказати. Наскільки мені відомо, немає ніякої роботи, що порівнює поведінку різних пошукових систем, щоб побачити, наскільки різноманітність пошукових систем не завжди повертається до того ж Важко знайти потрібні інструменти, один із способів - перевірити, яка організація налаштовує пошукову систему.

4) Інтелектуальна пошукова система

5) Відома компанія Ростелеком створила пошукову систему Супутник.

Є пошуковик Супутник, розроблений спеціально для дітей, про який я писала.

6) Рамблер був одним з перших вітчизняних пошукачів:

У світі є інші відомі пошуковики:

  • Bing,
  • Yahoo !,
  • DuckDuckGo,
  • Baidu,
  • Ecosia,

Спробуємо розібратися, як же працює пошукова система, а саме, як відбувається індексація сайтів, аналіз результатів індексації та формування пошукової видачі. Принципи роботи пошукових систем приблизно однакові: пошук інформації в Інтернеті, її зберігання та сортування для видачі у відповідь на запити користувачів. А ось алгоритми, за якими працюють пошукові системи, можуть сильно відрізнятися. Ці алгоритми тримаються в таємниці і заборонено її розголошення.

Ввівши один і той же запит в пошукові рядки різних пошукових систем, можна отримати різні відповіді. Причина в тому, що всі пошукові системи використовують власні алгоритми.

мета пошукових систем

В першу чергу потрібно знати про те, що пошукові системи - це комерційні організації. Їх мета - отримання прибутку. Прибуток можна отримувати з контекстної реклами, інших видів реклами, з просування потрібних сайтів на верхні рядки видачі. Загалом, способів багато.

Сподобалася стаття? Поділіться з друзями!