Инструкция для благодетелей и текстодателей
Прочли понравившуюся книгу? - Будьте добры,
пришлите список опечаток или исправленный текст.
Не нашли здесь достойной замечательной книги?
- Пришлите отOCRенный файл.
Этим вы внесете свой посильный вклад в развитие библиотеки.
Если Вы решили внести свой вклад в эту библиотеку, то - Welcome!
Приветствуются новые е-тексты интересных с _вашей_ точки зрения книг, а так
же - поправки, замечания, вычитанные spellcheck'нутые варианты на замену
существующим е-книгам. Во многих имеющихся здесь переводах отсутствует
фамилия переводчика, и это ужасно - очень хотелось бы восполнить эти
пробелы. Состав и качество текстов этой библиотеки определяется ее
читателями, я же здесь состою только "на приеме".
---------------------------------------------------------------
ВАЖНО: А вдруг эта книга уже есть? Или ее делает кто-то еще.
Запишите свои планы по сканированию (и проверьте на пересечение) в гостевой
"Книги, которые скоро будут выложены"
Поиск по автору и заглавию в Lib.Ru
Список крупных OCR библиотек
ВАЖНО: Сопроводительная информация
Присылая тексты, пожалуйста, не забывайте
про сопроводительную информацию:
Автор, Название произведения, дата написания
Для переводов, дополнительно:
Author Name, Title, date, Переводчик, дата перевода
Источник поступления текстов:
Для OCR: Печатный Источник, кто OCR'ил, кто делал spellcheck
Для электронных текстов: URL, authоr's-contact-email и home-page,...
---------------------------------------------------------------
На _все_ письма размером > 100Kb (т.е. содержащие тексты для
библиотеки) автоматически посылается подтверждение о получении "Thanks, I
have got your message" - а значит, письмо дошло и _обязательно_ будет
обработано.
Если Вы послали мне письмо, а ответа не пришло - то, скорее всего,
потому, что в письме неправильный обратный адрес или письмо погибло от
"delivery errors". Проверьте настройки своего мейлера. Я стараюсь отвечать
на все письма, подразумевающие необходимость ответа, хотя и с задержками,
ведь за прошлый год год я получил 20000 и написал 12000 писем.
---------------------------------------------------------------
И еще - "Библиотека в кармане-4,5,6,7" и загуменновский "HarryFan CD" с
текстами у меня есть. Прежде чем посылать, посмотрите - нет ли этого уже
в списке HarryFan CD
и списке "Библиотека в кармане-4"
---------------------------------------------------------------
Один из удобных (не единственный) видов корректуры текстов
Сделать
diff -U 2 filename.txt.orig filename.txt
и результат прислать мне в аттаче.
Если объем правки велик, то лучше присылать файл целиком на замену
Авторам литературных произведений, имеющим доступ в Интернет
Журнал "Самиздат" при библиотеке позволяет создавать авторские разделы и
переведен под полное авторское управление, с контролем статистики посещений,
оценками и читательским обсуждением. Милости просим
http://zhurnal.lib.ru
В "Самиздате" автор имеет полный контроль над размещением свои произведений,
а главное - _оперативность_. (Библиотека пополняется недостаточно быстро из-за
моей загруженности)
* Всем-всем-всем, кто предоставляет какие-либо тексты в библиотеку: *
* РОДНОЙ ФОРМАТ БИБЛИОТЕКИ *
Книги в библиотеке лежат в унифицированном текстовом формате, который
описан здесь.
К нему преобразуются все файлы, вами присылаемые. Чем "хуже" формат
присланного файла, тем больше будет мне с ним мороки при закладке в
библиотеку.
Файлы неудобных форматов ставятся в очередь на обработку. По состоянию
на 25 августа 2002 г. их там 1420. За день эта очередь продвигается вперед на
10-20 позиций.
Файлы удобных форматов обрабатываются вне очереди в день поступления.
Приветствуются и обрабатываются в первую очередь:
1. Кодировки koi8-r
2. Текстовые ASCII файлы, отформатированные БЕЗ ПЕРЕНОСОВ под 76
символов в строке, с АБЗАЦНЫМ ОТСТУПОМ (как в редакторе Lexicon), а также
комплекты файлов с оглавлениями mim.dir формата редактора "Микромир",
текстовые файлы формата редактора "Рк-Беста88" с оглавлениями .dir
А также rar и zip-архивы с текстами в формате HarryFan CD (т.е. в
альтернативной кодировке и оформленные в точности так же, как они оформлены
на этом компакт-диске).
Распознаются и принимаются:
1. Кодировки windows-1251, альтернативка cp866, iso8859-5.
2. Текстовые файлы с абзацами одной строкой (получаются при сохранении в
Word "Save as TEXT"").
HTML-файлы,
файлы Write for Windows *.WRI,
Word 6,7,95,98,2000 for Windows, в формате *.DOC, *.RTF,
картинки формата *.gif, *.jpg
3. Архивы {cpio|tar}/{gzip|bzip2|compress}, RAR, ZIP, однофайловые ARJ,
LHA, HA, ARC
4. Бинарные файлы, закодированные uuencode, MIME, base64
Распознаются, но не одобряются:
1. Кодировка "кокалеченный кои8" (к которой применена лишняя перекодировка
windows->koi8 (кто понимает о чем я), Translit-volapuk
2. Файлы формата TeX, PostScript
4. Бинарные файлы, закодированные макинтошевским BinHex 4.0, uuenн
cod-нутые файлы, порезанные на кусочки.
Распознаются, но порицаются:
2. Текстовые файлы БЕЗ выделения абзацев, которые получаются
сохранением "Save as MSDOS text" в Word 7.0 for Win95 (уж лучше прислать сам
.doc, чем калечить абзацы и терять авторский курсив).
Картинки формата *.bmp, *.pcx, *.tif, картинки размером > 1024x768,
файлы формата PDF (за свою величину).
3. Архивы AIN, UC2, многотомные архивы ARJ
4. Бинарные файлы, закодированные btoa
НЕ РАСПОЗНАЮТСЯ И НЕ ПРИНИМАЮТСЯ:
1. Кодировки неизвестные в природе, а также результаты нескольких
неочевидных перекодировок.
2. Таблицы формата Excel, PageMaker, прочие виндовые издательские форматы.
МНЕ НЕЧЕМ ИХ ЧИТАТЬ И ОБРАБАТЫВАТЬ.
Размер файлов неограничен - дойдет даже 5-мегабайтное письмо.
Incoming Anonymous ftp у меня больше не существует.
У меня есть автомат, который из текстового файла лепит простенький
HTML-файл (да еще на лету) - например, распознается LEXIKON-овская "раскраска"
- и превращается во всякие BOLD-ы, ITALIС-и и выделенные заголовки.
Если хочется сделать документ со встроенными картинками
(как в "Тумче-95" -
with-big-pictures.html AND with-icons.html ), то это очень просто.
Готовятся картинки с одним и тем же названием в двух форматах:
.gif-иконки размером 70x105
.jpg-основная картинка размером 280x420 или больше.
Желательно ограничить размер файлов: gif ~ 6-8 kb, jpg ~ 20-70 Kb,
а в отчет в нужных местах вставить ссылки на картинки примерно
в таком стиле:
-----------------------------------------------------
"Моя старушка Таймень"
Андрей Смирнов, & kartinki/tumcha/andrej_smirnow.jpg portret
главный рыбак
Каяк-одиночка "Соло" & kartinki/tumcha/kayak_solo.jpg
Максим Мошков, & kartinki/tumcha/maksim_moshkow.jpg portret
он же - Макс
-----------------------------------------------------
"&" - указывает на ссылку, "portret" значит картинка "стоя",
если без "portret" - значит, "лежа".
Да, и в табличках желательно обходиться без псевдографики, а
пользоваться обычными + - |
Ну а в HTML - получится автоматом.
----------------------------------------------------
Максим Мошков. moshkow@systud.msk.su
Last-modified: Thu, 21 Aug 2003 18:54:48 GMT