<МЕТА> - Украина | Блоги | Українська
<META> - Украина
Интернет
Реестр
Новости
Рефераты
Товары
Блоги
искать в блоге Записки шовиниста искать в постах/комментариях пользователя keva
Авторизация
Логин:
Пароль:
 
#

Категории

BMW (1)
Вино (17)
Киев (3)
кино (1)
мета (3)
#

Календарь

 Октябрь 
Пн
Вт
Ср
Чт
Пт
Сб
Вс
2
3
8
9
10
11
13
14
15
16
18
21
22
23
24
25
26
27
28
29
30
31
#

Записи

Суббота 24 мая 2014
Сообщение прочтено 500 раз
keva | 2014-05-24 09:23:16
С Днём Кирилла и Мефодия, создателей современной славянской письменности!
Четверг 3 января 2013
Сообщение прочтено 603 раз
keva | 2013-01-03 09:27:32
Насколько разный смысл имеют, при подобном грамматическом строе и лексическом составе, словосочетания "дать в глаз" и "дать в жопу". При этом замена всего лишь предлога делает смысл второй фразы схожим с первой: "дать под жопу". А замена существительного на совершенно безобидный "хвост" опять приводит к "дать под хвост", что уже может быть истолковано двояко.
Среда 1 августа 2012
Сообщение прочтено 261 раз
keva | 2012-08-01 11:35:28

Гурбангулы Бердымухамедов украл у Танирбергена Бердонгарова кораллы, а Танирберген Бердонгаров украл у Гурбангулы Бердымухамедова кларнет.

(c) не мое 

Воскресенье 29 июля 2012
Сообщение прочтено 371 раз
keva | 2012-07-29 12:57:24

Меню распивочной на Закинфе. Пятая строка.


Мы решительно отказались.

Суббота 19 февраля 2011

Устойчивые словосочетания в рамках некоторого массива текстов - это цепочки слов длиной L > 1, которые встречаются в этом массиве с частотой, сравнимой с частотой появления любых их расширений.

Иными словами, A B является устойчивым словосочетанием, если встречается в анализируемом массиве текстов сильно чаще, чем иные сочетания слов A и B с другими словами.

Специально заметим, что для разных массивов текстов устойчивые словосочетания будут разными: так, на нашем новостном массиве это будет один набор, на большом поисковом индексе по украинскому сегменту Интернет - другой.

В настоящий момент мы построили устойчивые двух- и трехсловные словосочетания для новостного массива, и приступаем к построению множества устойчивых словосочетаний для множества документов большого поискового индекса.

Для построения мы использовали непосредственно образы документов, которые хранятся на дисковых носителях наших проектов, так как тексты в них уже прошли предварительную обработку, фильтрацию и удавливание паразитного содержания, такого, как навигационная обвязка (алгоритм markupGelder), коммерческие ссылки (spamLink), и представляют собой статистически чистый от оформления набор текстов уникальных документов.

На первой фазе для каждого документа, состоящего из N слов, строится не более N-1 потенциальных двухсловных контактных словосочетаний и N-2 - трехсловных. "Не более" - потому, что знаки пунктуации не могут входить в короткие словосочетания по постановке задачи.

Выделенные кандидаты складываются в хранилище, сортируются с учетом морфологии русского, украинского или английского языка, а частоты их появлений суммируются. Результатом является массив двух- и трехсловных словосочетаний с частотами появлений в обработанном массиве текстов.

На второй стадии из этого массива выделяются словосочетания, частоты для которых превышают пороговое значение, которое может быть весьма и весьма свободным: действительно, если словосочетание - устойчивое, оно встретится в массиве на порядки большее количество раз, чем условно случайные сочетания слов.

Отобранные таким способом словосочетания проходят техническую нормализацию - определение грамматической структуры, проверку на "нужность" обнаруженной структуры и построение нормальной формы.

Сейчас обрабатываются именные группы - прилагательные, согласованные с определяемым словом, цепочки родительных падежей, персоны и, с большим штрафом, глаголы с зависимыми словами в винительном падеже (прямые дополнения)..

Вторник 23 ноября 2010

Наклевывается интересный проект совместно с верховной властью. Вероятно, будем делать. Значит, буду часто бывать в Киеве. Лиса, Олико - привет Smile

Качал сегодня плечи и ноги с относительно малыми весами, но в многоповторном режиме - "до пожара"...

Машка у меня заболела - в сад не ходила. Степан был один, так что и в клуб вечером с ним вдвоем ездили. Целовался с девочкой из детской комнаты. Девочка-воспитатель врет, что взасос.

Анька - спасибо всем - правит орфографические ошибки у себя на сайте, а я обтекаю позором: у меня, у одного из столпов автоматической проверки русской, блядь, орфографии, такая херня на сайте у жены!

Джавлон и Хайрилло смонтировали фальшбалки и профильную конструкцию потолка в мансарде. Опять хотят денег.

Вино вкусное. Чиаббата с сыром - тоже.

Спокойной ночи, МЕТА! Добрых вам снов, множественных оргазмов и сломанного будильника утром SmileSmile

Пятница 12 ноября 2010
Сообщение прочтено 2164 раз
keva | 2010-11-12 20:46:54

В ней только жене кой-чего хапнули.

Ну а я, в дополнение к keva.ru, прибрал к рукам "коваленко.com" SmileSmile

Вторник 24 августа 2010
Сообщение прочтено 760 раз
keva | 2010-08-24 10:24:13

И пусть независимость эта, к большому сожалению, сродни независимости Монголии, страны, от которой ничего не зависит - все равно...

С праздником.

Вторник 17 августа 2010
Сообщение прочтено 4054 раз
keva | 2010-08-17 09:33:01
Понятно, что не "блоггерши": уж очень слово неблагозвучное, нвевает мысли о кусачем шестилапом насекомом, оккупирующем волосистые части тела людей, не дружащих с мылом душистым и водными процедурами.Может, блогини? Бложанки? Или бложухи?
Голосование
Блогини, бложанки или бложухи?
1) Я - блогиня! Это обязывает, но я стараюсь соответствовать!
55%
2) Я - бложанка, и горжусь этим статусом!
6%
3) Я - бложуха, и не стесняюсь этого!
11%
4) Я тут просто мимо проползла.
28%
Всего проголосовало 18 человек
Пятница 23 июля 2010
Сообщение прочтено 1234 раз
keva | 2010-07-23 23:16:12

- Где пила? Признавайся, где пила?

- У соседа...

- Зачем соседу дала?!?!?!

- Пьяная была...

12Вперед | Указать страницу
Поиск:
ИнформацияОбщениеБизнесДосуг
добавить сайт | реклама на портале | контекстная реклама | контакты Copyright © 1998-2010 <META> Все права защищены