Архив

Публикации с меткой ‘поиск’

Стартапы-победители на конкурсе Seedcamp 2008

24 сентября 2008 2 комментария

Приветствуем наших читателей. Если вы следите за различными сетевыми конференциями и мероприятиями, где "тусуются" представители он-лайн мира, то вероятно слышали о недавно прошедшем, наверное, правильно сказать, фестивале или конференции Seedcamp 2008 в Лондоне 19 сентября. Там была и целая часть, посвящённая стартапам и поиску инвестиций, присутствовало множество венчурных инвесторов и представителей фондов. Само мероприятие было ориентировано на европейские компании, и это вдвойне ценнее - несмотря на формирование тренда за океаном, Европа также не отстает, и многим было просто интересно - в Старом свете уже сформировалась культура стартапов или как? Оказалось, все на месте, и в результате конкурсного отбора выявлено 7 победителей - самых интересный, перспективных и рыночных. Далее мы кратко рассмотрим каждый из них.
Читать далее...

«Петя летом отдыхает, Саша и Маша делают стартап!» — 10 последних проектов от Y Combinator

25 августа 2008 5 комментариев

Приветствую своих читателей. Прошу прощения за некоторую задержку - пришлось себе сделать что-то вроде небольшого отпуска, так как очень за год вымотался, а впереди ещё очень много работы. Но сейчас вроде постепенно приходим в форму и начинаем вести регулярно блог дальше. А поговорить сегодня я хочу снова о стартапах (хотя, честно, планировалась тема о виртуализации и стартап для автоматического создания и управления образами виртуальных машин, но он отложен на следующий раз). Мой самый любимый и уважаемый фонд Y Combinator презентовал четырнадцать стартапов, которые он выращивал на прошедшей летней сессии. Хотя по разным источникам я встречал упоминание о 10 или даже 20 стартапах, на самом деле их 21, хотя не все были показаны публично или о них есть какая-либо информация. Потому мы расскажем только о тех, что публично раскрыли себя.

Читать далее...

Полнотекстовый поиск в веб-проектах: Sphinx, Apache Lucene, Xapian

4 августа 2008 23 комментария

Полная авторская верcия.
Оригинал материала написан специально для Developers.org.ua

Наверное любой современный веб-проект сложно себе представить без... без контента! Да, именно контент в разных его проявлениях сегодня "правит бал" в различных веб-проектах. Не так важно - создаваемый пользователями или получаемый из других источников автоматически - информация является основной любого (ну, или почти любого) проекта. А раз так - то вопрос поиска необходимой информации стоит очень остро. И острее с каждым днем, ввиду стремительного расширения количества этого самого контента, в основном за счёт создаваемого пользователями (это и форумы, и блоги и модные нынче сообщества, вроде Habrahabr.ru). Таким образом, любой разработчик, реализующий сегодня какой-либо проект, сталкивается с потребностью реализовать поиск в своём веб-приложении. При этом требования к такому поиску уже намного сложнее и шире, чем даже год-два назад. Конечно, для каких-то проектов вполне подойдёт и простое решение, к примеру, вполне можно использовать Custom Google Search. Но чем более сложное приложение, и чем сложнее структура контента, если требуются особые виды поиска и обработки результата, или же просто количество или формат данных в вашем проекте особый, вам потребуется собственная поисковая система. Именно своя система, собственный поисковый сервер или сервис, а не сторонний, пусть даже гибкий и настраиваемый. Но что же выбрать, и вообще - какие сейчас на рынке есть поисковые проекты, которые готовы для использования в реальных проектах, не исследовательских или научных, а реальных бизнес-приложениях? Далее мы кратко рассмотрим различные варианты поисковых решений, пригодных для встраивания в ваше веб-приложение или развёртывания на собственном сервере.
Читать далее...

Автоматическое определение языка произвольного текста на РНР — библиотека PHPLangautodetect

Приветствуем наших читателей. Знаете, работа с стартапе, который пытается создать что-то новое и уникальное на рынке очень захватывает. И не только открывающимися возможностями, но и часто нетривиальными задачами и вопросами, которые ставятся перед создателями и которые раньше никто не решал. Вот один из таких вопросов как раз вчера появился передо мной: дано нам произвольную строку текста, заведомо известно, что она может быть двух, а в некоторых случаях и трёхязычной, то есть там смешанный текст из нескольких языков. Необходимо прозрачно для пользователя определить язык, на котором написан текст.

На самом деле задача не такая и редкая - подобная функциональность есть и в текстовых редакторах, и в переключателе клавиатуры PuntoSwitcher, да и в системах машинного перевода такой функционал востребован, не говоря уже про системы поиска информации. Кстати, именно в контексте создания специализированного поисковика и классификатора текстов и появилась такая проблема. Необходимо было получить такую возможность в собственной программе на платформе РНР и при этом не задействовать сторонние сервисы - подобная возможность в виде веб-сервиса присутствует в Google Language API (мы уже исследовали этот сервис), однако она выполняется удалённо и имеет некоторые существенные для нас ограничения, в частности, процедура опознания языка выполняется с существенной задержкой и асинхронна по своей природе. Кроме этого очень хотелось иметь полный контроль над процессом и иметь возможность его гибко настраивать, чего, увы, нет в сторонних сервисах. Поэтому пришлось подумать и попробовать реализовать собственными силами, результат же представляем вашему вниманию. Читать далее...

Developers.org.ua