О популярности Википедии говорить не приходится. В последнее время так же всё чаще входят в обиход малые вики для публикации узкотематической информации либо документации к проекту. При этом как бы текст вики-страниц не отображался, он отображается для людей и только для них. Машины парсят его как умеют, иногда хорошо, иногда не очень.
Вышесказанное было к тому, что очень интересен вопрос микроформатизации вики-проектов. Ведь как бы не была полезна отдельная страница с информацией, машина сама не поймёт, что там описывается процесс установки или контактная информация разработчиков (это если говорить о вики в применениии к документированию программы).
Вэтом плане есть несколько интересных направлений:
1. Семантическая вики — здесь речь про отношения между объектами (страницами). Для XFN простор неограниченный. Если будет интерес, я напишу про неё.
2. Геокодинг — вот здесь всё прекрасно, с микроформатом Geo работать легко, многое автоматизируется, серьёзых проблем нет.
3. Карточки персоналий и событий — речь про hCard, hCalendar и подобные. Остановимся подробнее:
Первый вопрос — а насколько это вообще надо. Если желательность микроформатизации страницы разработчика понятна (например, его можно добавить в контакнтую книгу), то на странице об актёре необходимость карточки (в данном случае hCard) не настолько очевидна.
Возможный аргумент «за» — перспектива улучшенной индексации поисковиками. Теоретически, возможность парсинга с непонятными целями (не намного сложнее распарсить вики-код, если используются шаблоны).
Аргумент «против» стандартный — сложность. Нет смысла строить отель в пустыне, в него всё равно никто не поедет жить.
Так действительно ли полезность перевешивает трудозатраты? Может, у кого-нибудь есть ответ?
Второй вопрос — сложность указания свойств. Если говорить конкретно о MediaWiki, то в нём абсолютно невозможно указать таких свойства как photo/logo и url, т. к. ссылки и изображения вставляются только с помощью внутренних механизмов. Многие другие движки в этом плане тоже дают не так много. Правда, некоторые допускают использование HTML-тегов «img» и «a», — это плюс им с позиции микроформатов, но существенный минус с позиции вики.
Этот момент может быть исправлен. Но, возвращаясь к первому вопросу, оно того стоит?
Итого, имеем: плюсы неочевидны, сложностей много.
PS: Этот пост был написан в связи с запуском проекта Микроформаты в русской Википедии. В английской он действует (см. интервики), но сложностей у них немеренно. Вот и хотелось бы понять, есть ли смысл.
Я недавно писал о поисковике нового поколения «True Knowledge», отвечающем на вопросы на естественном (английском) языке.
Сейчас его разработчики начали раздавать инвайты, поэтому кто хочет увидеть сервис собственными глазами - пишите в комментарии или мне на e-mail свой почтовый адрес - отправлю инвайт.
Дмитрий Уланов выложил материалы своей презентации на прошедшей вчера конференции, посвещённой социальным сетям и сервисам.
В ней описан логичное и обдуманное представление о том, как изменятся социальные сети и обычные сайты в ближайшем будущем и как они меняются прямо сейчас. Все, кому интересна данная тема - обязательно читайте :)
Наверно все уже и позабыли о RDF, а напрасно. Сегодня мы наконец вернемся к этой чудной теме.
1. Если вы уже зарегистрированы в livejournal.com, moikrug.ru или любом другом сервисе, предоставляющем OpenID, то ничего делать не нужно. Если нет - регистрируемся в любом провайдере OpenID (например, myopenid.com).
2. Идём на страничку вашего идентификатора (например, myname.openid.com, myname.livejournal.com и т.п.), открываем исходник страницы и ищем строку вида "<link rel="openid.server" href="адрес" />".
3. Вставляем в блок head вашей странички, которую вы хотите сделать идентификатором, следующие строки:
В итоге, на вашей страничке должно быть что-то вроде этого:
<head>
<!-- пропущено -->
<link rel="openid.server" href="http://www.myopenid.com/server" />
<link rel="openid.delegate" href="http://daeq.myopenid.com/" />
<!-- пропущено -->
</head>
Готово. Теперь вы можете идентифицироваться на других сайтах вашим собственным адресом. Кроме того, вы в любое время можете поменять OpenID-провайдера без изменения своего идентификатора.
Небольшой ролик. Так сказать, «OpenID для чайников».
Или что проиcходит когда технологии Web 2.0 объединить с Semantic Web…
Широкое развитие технологий Web 2.0 и социальных сетей привело к созданию новой концепции - Социальный Семантический Веб (Social Semantic Web).
Социальный Семантический Веб - это развитие концепции Semantic Web, в рамках которой социальные взаимодействия в Web можно использовать для создания семантически богатых (semantically rich) представлений знаний
К слову, семантически богатые знания (semantically rich knowledge) - это наиболее простая форма представления “поверхностных” знаний об объектах или процессах реального мира.
В тоже время, анализ интернет-источников показал, что понятие “семантически богатые знания” в русскоязычной части интернета не используется. Но в тоже время используются два понятия, которые иногда взаимоисключают или заменяют друг друга.
Первое - семантически обогащенные знания. Второе - семантически обогащенные данные.
Если семантически обогащенные знания по определению схожи с определением семантически богатых знаний, то с семантически обогащенными данными не все так просто......
...читайте дальше в блоге Сергея Щербака
Было замечено, что Digg.com при отображении новостей начал использовать RDFa (RDF, встроенный в HTML, о нём я скоро напишу подробнее). Это конструкции вида:
<a href="http://gothamist.com/2008/04/02/10table_super_b.php" rel="dc:source" property"dc:title">Tiffany & Co. to produce the NY Giant Ring. It's huge.</a>
Теперь программа, понимающая RDFa и загрузившая страничку Digg получит примерно такое RDF-представление новостей:
<rdf:Description rdf:about="http://localhost/arts_culture/Tiffany_Co_to_produce_the_NY_Giant_Ring_It_s_huge">
<ns2:source rdf:resource="http://gothamist.com/2008/04/02/10table_super_b.php"/>
<ns2:title>Tiffany & Co. to produce the NY Giant Ring. It's huge.</ns2:title>
<ns3:abstract rdf:parseType="Litera">Finally
a Tiffany right made from white gold, lots of diamond, and design that
a man can accept. Doesn\'t look too Tiffany to me though. Guys, will you
wear one of these?<a href="http://digg.com/arts_culture/Tiffany_Co_to_produce_the_NY_Giant_Ring_It_s_huge" class="more">MoreтАж</a></ns3:abstract>
<ns2:creator rdf:resource="http://digg.com/users/tradeprincess"/>
<ns2:date>2008-04-03 18:12:36</ns2:date>
</rdf:Description>
То, что вы видите, я сгенерировал с помощью ARC2 и теперь этот код может быть легко стандартным способом понят программами. Конечно, всю эту информацию можно получить и из RSS, но это только начало. Хорошо, что гигантские проекты вроде Digg начинают обращать внимание на сеть данных.
Уже не первое десятилетие люди мечтают о компьютере, который сможет общаться с человеком на понятном ему языке, обладая при этом намного большими познаниями, чем обычный человек.
Исследователи из Кембриджа пытаются решить эту задачу, создав систему "True Knowledge", которая будет отвечать на самые разнообразные вопросы пользователей, заданные на обычном разговорном языке. И отвечать не ссылками на страницы или цитатами с них, а фактами.
Система добывает знания из разных источников (википедия, странички в интернете, внесение людьми напрямую) и приводит их в форму, похожую на RDF (тройкам объект-предикат-субъект), основу сети данных. При вводе запроса пользователем она приводит этот запрос к подобному виду и находит соответствия в базе знаний.
Сейчас система находится в бета-тестировании и я, подождав пару месяцев, наконец получил приглашение попробовать её в деле. При входе система сразу же предлагает попробовать её на вопросах вроде "Who wrote Principia Mathematica?" или "Are any snakes herbivorous?". Конечно, с такими вопросами система справляется на отлично, отвечая двумя вариантами на первый вопрос (для двух разных книг с одинаковым названием) и категорическим "нет" на второй.
Я решил попробовать её на чём-то более сложном.
Who is the wife of Vladimir Putin?
Совсем неплохо.
When was John Lennon killed?
Слова killed система не знает. Уже хуже.
When was John Lennon born?
the year 1940. Тут справилась.
Если вы задаёте вопрос, которому может быть несколько толкований, система уточняет, что же именно вы имели в виду?
Также любому желающему предлагается пополнить базу знаний системы объектом, понятием или фактом, а также подтвердить или опровергнуть любой из сохранённых ею фактов.
РезюмеПриятно, что сеть данных (она же семантический веб) обретает вполне реальное и достаточно полезное применение. Конечно, для замены обычных поисковых движков эта система пока не годится, но она близка к этому. База понятий и фактов будет пополняться, и скоро, я верю, она сможет ответить на почти любой каверзный вопрос. И алгоритмы, положенные в её основу помогут со временем создать настоящую экспертную систему общего назначения, или, проще говоря, искусственный интеллект в популяризированном смысле этого слова.
Амит Кумар из Yahoo! написал в Yahoo! Search Blog о том, что компания собирается постепенно внедрять поиск по семантическому вебу (он же сеть данных).
Yahoo! будет индексировать микроформаты (hCard, hCalendar, hReview, hAtom, XFN), RDFa-разметку (RDF-тройки, расположенные прямо на html-страницах), Dublin Core, FOAF, GeoRSS, MediaRSS и много чего ещё.
Таким образом Yahoo! будет первой крупной интернет-компанией, серьёзно использующей сеть данных. И ещё это значит, что 2008 год не зря называли годом бурного развития семантического веба.
Что может лучше визуального объяснения феномена? Правильно — ничего! На этот раз попробуем разобраться, как формируется общественное мнение через взаимодействие новых и традиционных медиа. И изюминка визуализации — как легко при знании соответствующих инструментов происходит инфильтрация в общественное мнение.
Иллюстрация настолько очевидна, что мой мозг не смог доказать моей лени необходимость перевода оной на русский язык. Однако она не так проста, как кажется на первый взгляд. По крайней мере, есть над чем подумать…
Нашёл здесь
© Igor Kandyba для More Intelligent Web, 2009. |
Постоянная ссылка |
Нет комментариев |
Добавить в
del.icio.us
Теги: традиционные медиа
Скорее всего, в ближайшее время буду взрывать ваш мозг темой поисковиков. Вроде, в этом блоге она особо и не затрагивалась. А надо бы, ведь новостей куча, плюс поиск это то, на чём строится Интернет (и не говорите мне про гипертекст). Поисковики совершествуются, эволюционируют, умирают, у них появляются совершенно чумовые фичи, о которых пару лет назад мы не могли даже мечтать. Наконец, появляются новые поисковики.
Вот об относительно новой вещи сегодня и пойдёт речь.
Сервис под названием Zakta совмещает функциональность веб-поиска, вики и социальных наворотов, и все это с целью улучшить наш экспириенс и позволить найти кратчайший путь в поиске информации.
Проще говоря, поисковик создан, чтобы решить основную проблему поисковиков — так называемый SERP — страница выдачи результатов. Скажете, что же в ней не так? Да всё! Если вы довольны списком из 20—30 ссылок с сомнительной релевантностью, значит лучше вам сразу же отписаться от моего блога :)
Поисковик добавляет к выдаче еще один слой, который позволяет лучше организовать полученную информацию. И слой этот — человеческий. Да, именно пользователи сервиса принимают активное участие в формировании выдачи, тем самым значительно повышая её релевантность.
Мало того, информация семантически структурируется и разбивается по категориям. Например, задав в строке поиска «Honda Civic», мне предлагается почитать про историю модели, посмотреть предлагаемые запчасти, при этом идёт разбивка по различным её поколениям, и отдельной категорией — где её можно приобрести. Таким образом, время на решение конкретной задачи значительно сокращается. Фактически, поисковик помогает мне думать, если я не знаю, что точно хочу.
И плюс, не забывайте — рекомендации пользователей. Так называемый социальный слой. По высоко- и среднечастотным запросам результаты довольно хороши, а на редких запросах социализация и интеллектуализация поисковика не так ощущаются.
Таким образом, это очень неплохая попытка совместить в едином то, к чему сейчас движутся мостры поискового бизнеса — социальные элементы, визуализацию выдачи, и семантическую составляющую. И попытка, надо сказать, очень неплохая.
Потестить можно прямо здесь: zakta.com
© Igor Kandyba для More Intelligent Web, 2009. |
Постоянная ссылка |
Нет комментариев |
Добавить в
del.icio.us
Теги: поиск
На днях я перевёл все свои основные блоги на систему комментариев от Disqus (http://www.disqus.com)
Теперь он запущен на:
Главные плюсы – простота установки, удобство комментирования, поддержка авторизации через OpenID и Twitter, гибкость модерации и ведения черных и белых список и так далее
Главные минусы – это то что комментарии на сайте подгружаются через JavaScript и не индексируются поисковиками, не весь интерфейс переведён, нет российской специфики вроде авторизации через Яндекс (впрочем, имхо, не особо она и нужна).
И, ещё один, возможно даже ключевой плюс. Disqus можно подключать не только к блогам, но и к сайтам, что и собственно было сделано в случае OpenGovData.ru.
Так что от всех интересующихся жду замечаний/пожеланий/предложений к источникам данных, документам и собранным датасетам.
Примеры того как комментарии выглядят есть тут – http://opengovdata.ru/opendata/5/
Кстати, по поводу блогов чиновников без комментариев.
А можно и сделать такой федеральный проект на много миллионов рублей, провести его под эгидой ФСО, нанять толпу модераторов и отслеживать все неанонимные мнения (с использованием российской криптографии, разумеется).
Но куда проще будет прикрутить возможность комментирования можно и с помощью Disqus’а и с помощью схожих конкурирующих сервисов.
Небольшое визуальное изображение одной из систем аутентификаций. Больше здесь. Пост специально для «поглощающих информацию».
Picture credit: Flickr
© Igor Kandyba для More Intelligent Web, 2009. |
Постоянная ссылка |
Нет комментариев |
Добавить в
del.icio.us
Теги: oAuth
Последние комментарии
1 год 28 недель назад
1 год 28 недель назад