Единый каталог знаний. Information indexing.

11 февраля 2012, 12:47
инженер
0
370

каталогизация и поиск

Продолжу свои мысли по поводу упорядочивания Интернета.




У меня много файлов, закачанных с файлообменных сетей и др. источников. При размере Вашей библиотеки более 100 ГБ поиск информации становится затруднителен. Выход, с моей точки зрения, в дополнении всех объектов тэгами и идентификатором, подобно тому, как это сделано в каталогах библиотек. Дерево каталога на компьютере может быть упрощенной или полной копией общего каталога человеческих знаний. Как правильно организовать индексирование в смежных областях знаний, переиздания книг, цитирования в тексте и пр. – задача специалистов, тут я могу только предполагать.

Т.о. при поиске файла или просто при перемещении по дереву знаний вы можете достаточно быстро найти нужный или приблизительно нужный документ, а также исключить дубликаты, оставить исходный документ и т.д.

Поиск и фильтрация при этом станут значительно более мощными и гибкими.

Возможен, конечно, второй вариант – разрабатывать средства распознавания текста, голоса, изображений, но есть недостаток такой системы автоматической индексации – многие документы не будут оцифрованы в ближайшем будущем, кроме того, цифра, правильная или ложная, станет «посредником» между Вами и настоящим источником.

Набросаю теперь основы второй системы – я пока такой в Интернете не видел, хотя технически давно можно ее создать.

Итак, у Вас есть новость (просто информация, книга, фотография, видео или что-либо, первооткрытие или создание которой Вы бы хотели доказать).

Сама информация или ее контрольная сумма (хэш, что там еще…) подписывается вашим сертификатом и отправляется в доверенный центр подписи, в котором время подписывания и сама подпись обеспечиваются специальным, международно-признанным комплексом мер. В ответ Вы получаете уже дважды подписанный файл. Копия остается на сервере.

После этого даже опубликованный оригинал никто более не сможет подписать более ранней датой…

При соблюдении мер безопасности, конечно.

Неділя, 23 серпня 2009 р.

Сайтов с авторизацией развелось, как собак нерезаных.

Вот уже несколько лет развиваются в интернете системы типа openid - некоторый результат есть, однако, большинство систем продолжают поддерживать только свою авторизацию.
Оно и понятно, чем больше вы знаете о клиенте подробностей, тем больше рекламы вы продадите. А если песочница у вас своя и, переходя в другую, пользователь тратит время, нервы и пр. (не сам же он "туда" пойдет).

Поэтому на сегодня "маємо те, що маємо".

А делать надо так:
  1. с 01.06.2010г. регистрация пользователя на сайте запрещена. Куки - Ваши, пользуйтесь, а вот авторизация - только через сервера типа openid.
  2. до 01.06.2010г. провести аудит систем типа openid на предмет утечки или стороннего использования информации личного характера.
По поводу самих систем openid: заходя на сайт, например, миртесен, ввожу свое имя на сервере авторизации openid.com, т.о. статистика на меня все равно накапливается. И мое имя при входе - тот самый поплавок.
А надо при входе подписать открытым ключом мое имя, а вторая половина ключа лежит на openid и соблюдает мою анонимность. Т. о. каждый новый вход - с новым именем с точки зрения системы "Миртесен".

И главное, поменьше "тактичности" к сетевым предприятиям - гнуть свое - они никуда не денутся - слишком многое уже вложено в игру.
Рубрика "Я - Корреспондент" является площадкой свободной журналистики и не модерируется редакцией. Пользователи самостоятельно загружают свои материалы на сайт. Редакция не разделяет позицию блогеров и не отвечает за достоверность изложенных ими фактов.
РАЗДЕЛ: Пользователи
Если вы заметили ошибку, выделите необходимый текст и нажмите Ctrl+Enter, чтобы сообщить об этом редакции.