Сборщик RSS-лент

Микроформаты и вики: введение, карточки

netevolution.ru - Сб, 10/17/2009 - 13:30

О популярности Википедии говорить не приходится. В последнее время так же всё чаще входят в обиход малые вики для публикации узкотематической информации либо документации к проекту. При этом как бы текст вики-страниц не отображался, он отображается для людей и только для них. Машины парсят его как умеют, иногда хорошо, иногда не очень.

Вышесказанное было к тому, что очень интересен вопрос микроформатизации вики-проектов. Ведь как бы не была полезна отдельная страница с информацией, машина сама не поймёт, что там описывается процесс установки или контактная информация разработчиков (это если говорить о вики в применениии к документированию программы).

Вэтом плане есть несколько интересных направлений:
1. Семантическая вики — здесь речь про отношения между объектами (страницами). Для XFN простор неограниченный. Если будет интерес, я напишу про неё.
2. Геокодинг — вот здесь всё прекрасно, с микроформатом Geo работать легко, многое автоматизируется, серьёзых проблем нет.
3. Карточки персоналий и событий — речь про hCard, hCalendar и подобные. Остановимся подробнее:

Первый вопрос — а насколько это вообще надо. Если желательность микроформатизации страницы разработчика понятна (например, его можно добавить в контакнтую книгу), то на странице об актёре необходимость карточки (в данном случае hCard) не настолько очевидна.
Возможный аргумент «за» — перспектива улучшенной индексации поисковиками. Теоретически, возможность парсинга с непонятными целями (не намного сложнее распарсить вики-код, если используются шаблоны).
Аргумент «против» стандартный — сложность. Нет смысла строить отель в пустыне, в него всё равно никто не поедет жить.
Так действительно ли полезность перевешивает трудозатраты? Может, у кого-нибудь есть ответ?

Второй вопрос — сложность указания свойств. Если говорить конкретно о MediaWiki, то в нём абсолютно невозможно указать таких свойства как photo/logo и url, т. к. ссылки и изображения вставляются только с помощью внутренних механизмов. Многие другие движки в этом плане тоже дают не так много. Правда, некоторые допускают использование HTML-тегов «img» и «a», — это плюс им с позиции микроформатов, но существенный минус с позиции вики.
Этот момент может быть исправлен. Но, возвращаясь к первому вопросу, оно того стоит?

Итого, имеем: плюсы неочевидны, сложностей много.

PS: Этот пост был написан в связи с запуском проекта Микроформаты в русской Википедии. В английской он действует (см. интервики), но сложностей у них немеренно. Вот и хотелось бы понять, есть ли смысл.

Категории: Semantic Web

Инвайты на TrueKnowledge

netevolution.ru - Сб, 10/17/2009 - 13:30

Я недавно писал о поисковике нового поколения «True Knowledge», отвечающем на вопросы на естественном (английском) языке.

Сейчас его разработчики начали раздавать инвайты, поэтому кто хочет увидеть сервис собственными глазами - пишите в комментарии или мне на e-mail свой почтовый адрес - отправлю инвайт.

Категории: Semantic Web

Презентация Дмитрия Уланова на Social Experience 2008

netevolution.ru - Сб, 10/17/2009 - 13:30

Дмитрий Уланов выложил материалы своей презентации на прошедшей вчера конференции, посвещённой социальным сетям и сервисам.

В ней описан логичное и обдуманное представление о том, как изменятся социальные сети и обычные сайты в ближайшем будущем и как они меняются прямо сейчас. Все, кому интересна данная тема - обязательно читайте :)

Категории: Semantic Web

Введение в RDFa

netevolution.ru - Сб, 10/17/2009 - 13:30

Наверно все уже и позабыли о RDF, а напрасно. Сегодня мы наконец вернемся к этой чудной теме.

продолжение в блоге Футуриуса...

Категории: Semantic Web

Как сделать свой сайт OpenID-идентификатором

netevolution.ru - Сб, 10/17/2009 - 13:30

1. Если вы уже зарегистрированы в livejournal.com, moikrug.ru или любом другом сервисе, предоставляющем OpenID, то ничего делать не нужно. Если нет - регистрируемся в любом провайдере OpenID (например, myopenid.com).
2. Идём на страничку вашего идентификатора (например, myname.openid.com, myname.livejournal.com и т.п.), открываем исходник страницы и ищем строку вида "<link rel="openid.server" href="адрес" />".

3. Вставляем в блок head вашей странички, которую вы хотите сделать идентификатором, следующие строки:

  • "<link rel="openid.server" href="адрес" />" - ту, которую вы нашли перед этим
  • "<link rel="openid.delegate" href="адрес" />", где адрес - это OpenID-идентификатор, предоставляемый вашим провайдером (например, myname.openid.com)

В итоге, на вашей страничке должно быть что-то вроде этого:

<head>
<!-- пропущено -->
<link rel="openid.server" href="http://www.myopenid.com/server" />
<link rel="openid.delegate" href="http://daeq.myopenid.com/" />
<!-- пропущено -->
</head>

Готово. Теперь вы можете идентифицироваться на других сайтах вашим собственным адресом. Кроме того, вы в любое время можете поменять OpenID-провайдера без изменения своего идентификатора.

Категории: Semantic Web

Что такое OpenID (Видео)

netevolution.ru - Сб, 10/17/2009 - 13:30

Небольшой ролик. Так сказать, «OpenID для чайников».

Ссылка на видео в лучшем качестве

Категории: Semantic Web

Социальный Semantic Web...

netevolution.ru - Сб, 10/17/2009 - 13:30

Или что проиcходит когда технологии Web 2.0 объединить с Semantic Web…

Широкое развитие технологий Web 2.0 и социальных сетей привело к созданию новой концепции - Социальный Семантический Веб (Social Semantic Web).

Социальный Семантический Веб - это развитие концепции Semantic Web, в рамках которой социальные взаимодействия в Web можно использовать для создания семантически богатых (semantically rich) представлений знаний

К слову, семантически богатые знания (semantically rich knowledge) - это наиболее простая форма представления “поверхностных” знаний об объектах или процессах реального мира.

В тоже время, анализ интернет-источников показал, что понятие “семантически богатые знания” в русскоязычной части интернета не используется. Но в тоже время используются два понятия, которые иногда взаимоисключают или заменяют друг друга.

Первое - семантически обогащенные знания. Второе - семантически обогащенные данные.

Если семантически обогащенные знания по определению схожи с определением семантически богатых знаний, то с семантически обогащенными данными не все так просто......
...читайте дальше в блоге Сергея Щербака

Категории: Semantic Web

Digg начал использовать семантическую разметку

netevolution.ru - Сб, 10/17/2009 - 13:30

Было замечено, что Digg.com при отображении новостей начал использовать RDFa (RDF, встроенный в HTML, о нём я скоро напишу подробнее). Это конструкции вида:

<a href="http://gothamist.com/2008/04/02/10table_super_b.php" rel="dc:source" property"dc:title">Tiffany & Co. to produce the NY Giant Ring. It's huge.</a>

Теперь программа, понимающая RDFa и загрузившая страничку Digg получит примерно такое RDF-представление новостей:

<rdf:Description rdf:about="http://localhost/arts_culture/Tiffany_Co_to_produce_the_NY_Giant_Ring_It_s_huge">
<ns2:source rdf:resource="http://gothamist.com/2008/04/02/10table_super_b.php"/>
<ns2:title>Tiffany & Co. to produce the NY Giant Ring. It's huge.</ns2:title>
<ns3:abstract rdf:parseType="Litera">Finally
a Tiffany right made from white gold, lots of diamond, and design that
a man can accept. Doesn\'t look too Tiffany to me though. Guys, will you
wear one of these?<a href="http://digg.com/arts_culture/Tiffany_Co_to_produce_the_NY_Giant_Ring_It_s_huge" class="more">MoreтАж</a></ns3:abstract>
<ns2:creator rdf:resource="http://digg.com/users/tradeprincess"/>
<ns2:date>2008-04-03 18:12:36</ns2:date>
</rdf:Description>

То, что вы видите, я сгенерировал с помощью ARC2 и теперь этот код может быть легко стандартным способом понят программами. Конечно, всю эту информацию можно получить и из RSS, но это только начало. Хорошо, что гигантские проекты вроде Digg начинают обращать внимание на сеть данных.

Категории: Semantic Web

True Knowledge - система ответов на самые разные вопросы

netevolution.ru - Сб, 10/17/2009 - 13:30

Уже не первое десятилетие люди мечтают о компьютере, который сможет общаться с человеком на понятном ему языке, обладая при этом намного большими познаниями, чем обычный человек.

Исследователи из Кембриджа пытаются решить эту задачу, создав систему "True Knowledge", которая будет отвечать на самые разнообразные вопросы пользователей, заданные на обычном разговорном языке. И отвечать не ссылками на страницы или цитатами с них, а фактами.

Система добывает знания из разных источников (википедия, странички в интернете, внесение людьми напрямую) и приводит их в форму, похожую на RDF (тройкам объект-предикат-субъект), основу сети данных. При вводе запроса пользователем она приводит этот запрос к подобному виду и находит соответствия в базе знаний.

Сейчас система находится в бета-тестировании и я, подождав пару месяцев, наконец получил приглашение попробовать её в деле. При входе система сразу же предлагает попробовать её на вопросах вроде "Who wrote Principia Mathematica?" или "Are any snakes herbivorous?". Конечно, с такими вопросами система справляется на отлично, отвечая двумя вариантами на первый вопрос (для двух разных книг с одинаковым названием) и категорическим "нет" на второй.

Я решил попробовать её на чём-то более сложном.
Who is the wife of Vladimir Putin?

Совсем неплохо.

When was John Lennon killed?
Слова killed система не знает. Уже хуже.

When was John Lennon born?
the year 1940. Тут справилась.

Если вы задаёте вопрос, которому может быть несколько толкований, система уточняет, что же именно вы имели в виду?

Также любому желающему предлагается пополнить базу знаний системы объектом, понятием или фактом, а также подтвердить или опровергнуть любой из сохранённых ею фактов.

Резюме

Приятно, что сеть данных (она же семантический веб) обретает вполне реальное и достаточно полезное применение. Конечно, для замены обычных поисковых движков эта система пока не годится, но она близка к этому. База понятий и фактов будет пополняться, и скоро, я верю, она сможет ответить на почти любой каверзный вопрос. И алгоритмы, положенные в её основу помогут со временем создать настоящую экспертную систему общего назначения, или, проще говоря, искусственный интеллект в популяризированном смысле этого слова.

Категории: Semantic Web

Yahoo использует семантические метаданные при поиске

netevolution.ru - Сб, 10/17/2009 - 13:30


Амит Кумар из Yahoo! написал в Yahoo! Search Blog о том, что компания собирается постепенно внедрять поиск по семантическому вебу (он же сеть данных).

Yahoo! будет индексировать микроформаты (hCard, hCalendar, hReview, hAtom, XFN), RDFa-разметку (RDF-тройки, расположенные прямо на html-страницах), Dublin Core, FOAF, GeoRSS, MediaRSS и много чего ещё.

Таким образом Yahoo! будет первой крупной интернет-компанией, серьёзно использующей сеть данных. И ещё это значит, что 2008 год не зря называли годом бурного развития семантического веба.

Категории: Semantic Web

More Intelligent Web — Наглядно О Новых Медиа

Новости с ленты webofdata.ru - Пт, 10/09/2009 - 16:20

Что может лучше визуального объяснения феномена? Правильно — ничего! На этот раз попробуем разобраться, как формируется общественное мнение через взаимодействие новых и традиционных медиа. И изюминка визуализации — как легко при знании соответствующих инструментов происходит инфильтрация в общественное мнение.

Иллюстрация настолько очевидна, что мой мозг не смог доказать моей лени необходимость перевода оной на русский язык. Однако она не так проста, как кажется на первый взгляд. По крайней мере, есть над чем подумать…

Нашёл здесь

© Igor Kandyba для More Intelligent Web, 2009. | Постоянная ссылка | Нет комментариев | Добавить в del.icio.us
Теги: традиционные медиа

Категории: Semantic Web

More Intelligent Web — Интеллектуальный Поиск Zakta

Новости с ленты webofdata.ru - Пнд, 09/28/2009 - 16:22

Скорее всего, в ближайшее время  буду взрывать ваш мозг темой поисковиков. Вроде, в этом блоге она особо и не затрагивалась. А надо бы, ведь новостей куча, плюс поиск это то, на чём строится Интернет (и не говорите мне про гипертекст). Поисковики совершествуются, эволюционируют, умирают, у них появляются совершенно чумовые фичи, о которых пару лет назад мы не могли даже мечтать. Наконец, появляются новые поисковики.

Вот об относительно новой вещи сегодня и пойдёт речь.

Сервис под названием Zakta совмещает функциональность веб-поиска, вики и социальных наворотов, и все это с целью улучшить наш экспириенс и позволить найти кратчайший путь в поиске информации.

Проще говоря, поисковик создан, чтобы решить основную проблему поисковиков — так называемый SERP — страница выдачи результатов. Скажете, что же в ней не так? Да всё! Если вы довольны списком из 20—30 ссылок с сомнительной релевантностью, значит лучше вам сразу же отписаться от моего блога :)


Поисковик добавляет к выдаче еще один слой, который позволяет лучше организовать полученную информацию. И слой этот — человеческий. Да, именно пользователи сервиса принимают активное участие в формировании выдачи, тем самым значительно повышая её релевантность.

Мало того, информация семантически структурируется и разбивается по категориям. Например, задав в строке поиска «Honda Civic», мне предлагается почитать про историю модели, посмотреть предлагаемые запчасти, при этом идёт разбивка по различным её поколениям, и отдельной категорией — где её можно приобрести. Таким образом, время на решение конкретной задачи значительно сокращается. Фактически, поисковик помогает мне думать, если я не знаю, что точно хочу.

И плюс, не забывайте — рекомендации пользователей. Так называемый социальный слой. По высоко- и среднечастотным запросам результаты довольно хороши, а на редких запросах социализация и интеллектуализация поисковика не так ощущаются.

Таким образом, это очень неплохая попытка совместить в едином то, к чему сейчас движутся мостры поискового бизнеса — социальные элементы, визуализацию выдачи, и семантическую составляющую. И попытка, надо сказать, очень неплохая.

Потестить можно прямо здесь: zakta.com

© Igor Kandyba для More Intelligent Web, 2009. | Постоянная ссылка | Нет комментариев | Добавить в del.icio.us
Теги: поиск

Категории: Semantic Web

SHCHERBAK.NET — Новый Семантик: Островок Щербака

Новости с ленты webofdata.ru - Чт, 09/24/2009 - 13:04
Итак, технически все готово к публичному открытию нового семантик ресурса. Сейчас готовлю островок имени себя на новом сайте и всем волонтерам пришлю инвайты на доступ к ресурсу. В качестве поощрения волонтерам предлагаю сформировать резюме с указанием свох умений и заслуг в сфере Семантик. (По крайней мере еще десяток резюме я согласен разместить) Поможем инвесторам найти нас специалистов [...]
Категории: Semantic Web

Иван Бегтин — Disqus и комментарии к OpenGovData

Новости с ленты webofdata.ru - Ср, 09/16/2009 - 11:13

На днях я перевёл все свои основные блоги на систему комментариев от Disqus (http://www.disqus.com)

Теперь он запущен на:

Главные плюсы – простота установки, удобство комментирования, поддержка авторизации через OpenID и Twitter, гибкость модерации и ведения черных и белых список и так далее

Главные минусы – это то что комментарии на сайте подгружаются через JavaScript и не индексируются поисковиками, не весь интерфейс переведён, нет российской специфики вроде авторизации через Яндекс (впрочем, имхо, не особо она и нужна).

И, ещё один, возможно даже ключевой плюс. Disqus можно подключать не только к блогам, но и к сайтам, что и собственно было сделано в случае OpenGovData.ru.

Так что от всех интересующихся жду замечаний/пожеланий/предложений к источникам данных, документам и собранным датасетам.

Примеры того как комментарии выглядят есть тут – http://opengovdata.ru/opendata/5/

Кстати, по поводу блогов чиновников без комментариев.

А можно и сделать такой федеральный проект на много миллионов рублей, провести его под эгидой ФСО, нанять толпу модераторов и отслеживать все неанонимные мнения (с использованием российской криптографии, разумеется).

Но куда проще будет прикрутить возможность комментирования можно и с помощью Disqus’а и с помощью схожих конкурирующих сервисов.

Категории: Semantic Web

SHCHERBAK.NET — Дней десять еще!!!

Новости с ленты webofdata.ru - Ср, 09/02/2009 - 17:52
Ув. читатели, как видите в последнее время на shcherbak.net не много обновлений. Новостей в мире Semantic Web много! но новый ресурс на подходе – осталось совсем чуть-чуть. Уже шаблоны статей и других материалов готовы. Поддержка Latex есть. Процедура переноса материалов началась. статьи со shcherbak.net потехоньку удаляются. Прошу прощенье за то, что не успел всем ответить [...]
Категории: Semantic Web

More Intelligent Web — oAuth

Новости с ленты webofdata.ru - Ср, 08/26/2009 - 08:21

Небольшое визуальное изображение одной из систем аутентификаций. Больше здесь. Пост специально для «поглощающих информацию».

Picture credit: Flickr

© Igor Kandyba для More Intelligent Web, 2009. | Постоянная ссылка | Нет комментариев | Добавить в del.icio.us
Теги: oAuth

Категории: Semantic Web

SHCHERBAK.NET — Shcherbak.net на реконструкции…

Новости с ленты webofdata.ru - Пнд, 08/17/2009 - 00:13
Плановые работы… Как и было обещано! Связанные записи: Развитие SHCHERBAK.NET: набор промо-баннеров от Ann’ы 8 Марта – Международный женский день! Развитие ресурса – переeзд на новый сервер завершен! OpenID на SHCHERBAK.NET! (Развитие ресурса) XMLHack.ru закрылся…
Категории: Semantic Web

SHCHERBAK.NET — XMLHack.ru закрылся…

Новости с ленты webofdata.ru - Ср, 08/12/2009 - 20:52
Сегодня увидел крайне печальную новость – XMLHACK.RU закрылся. XMLHACK.RU – сайт, который мне очень нравился, и в пору, когда в рунете еще об xml никто толком и не знал, этот сайт был прекрасным навигатором в мире XML. Кроме того, я считаю и думаю все со мною согласятся xmlhack.ru был ведущим и самым посещаемым сайтом по XML [...]
Категории: Semantic Web

SHCHERBAK.NET — XMLHack.ru закрылся…

Новости с ленты webofdata.ru - Ср, 08/12/2009 - 20:52
Сегодня увидел крайне печальную новость – XMLHACK.RU закрылся. XMLHACK.RU – сайт, который мне очень нравился, и в пору, когда в рунете еще об xml никто толком и не знал, этот сайт был прекрасным навигатором в мире XML. Кроме того, я считаю и думаю все со мною согласятся xmlhack.ru был ведущим и самым посещаемым сайтом по XML [...]
Категории: Semantic Web

SHCHERBAK.NET — SHCHERBAK.NET и Semantic Web: конец или начало?

Новости с ленты webofdata.ru - Пнд, 08/10/2009 - 11:10
Что говорить, но SHCHERBAK.NET честно отработал почти два года на благо  русскоязычного сообщества Semantic Web. В рамках него было собрано много материалов по различным аспектам  Semantic Web, много людей получило базовые познания о SW и связанным  технологиям, мне кажется ресурс был полезен. Общем, я принял решение о закрытии этого сайта, как хранилища  информации по SW. Так как вокруг SHCHERBAK.NET [...]
Категории: Semantic Web
RSS-материал