Перейти к содержимому

Уважаемые участники Форума. Если Вы забыли пароль или логин, напишите на почту voroninee@yandex.ru Для гостей, кто регистрируется: в поле антиспама нужно вводить цифры, а не пытаться скопировать текст (на то он и антиспам); Ваша регистрация чуть позднее активируется админом, о чём Вы получите уведомление на почту.

20 апреля в 10:30 в библиотеке № 13 им. Ф. М. Достоевского состоится заседание Ярославского историко-родословного общества. Обсудить >>>

22.03.2022. Обновлён Фамильный навигатор: добавлено 15 новых позиций (с 26.02.2022). Всего в справочнике 7221 позиция >>>

"Именной список убитым, раненым и без вести пропавшим нижним чинам". СПб, 1914, 1915. (Выборка по уроженцам Ярославской губ.)

именные списки погибших Первая мировая война войны ярославцы базы данных пропавшие без вести

  • Авторизуйтесь для ответа в теме
Сообщений в теме: 218

#141 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 25 февраля 2012 - 00:48

Просмотр сообщенияЕвгений Воронин (25 февраля 2012 - 00:19) писал:

Уверен, что список нужно оставить таким, каков он есть в исходном справочнике. Без правок.

Евгений, без правок вообще? Или не удалять повторяющие записи?

#142 Darya V

Darya V

    Совет ЯрИРО

  • Ветераны
  • PipPipPipPipPip
  • 29 308 сообщений

Отправлено 25 февраля 2012 - 00:58

Просмотр сообщенияciandr (24 февраля 2012 - 20:11) писал:

...придется серьезно поработать с волостями и нас. пунктами - исправить, где возможно, ошибки...

Андрей прав, ошибки в названиях населённых пунктов надо исправлять!

Например, тут у последнего - "Даниловского. Боровичской в."
В Даниловском уезде была Боровская волость! Это точно она.

А тут у последнего - "Некоизской".
Должно быть, конечно, "Некоузской".

Зачем оставлять неверные описания (т.е. ошибки, опечатки оригинала)?
Надо, чтоб было у всех едино. Например - люди из Некоузской волости. Чтобы не был в базе среди них кто-то с "Некоизской" волостью.

#143 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 25 февраля 2012 - 01:23

По большому счету, спорить не о чем, так как:
1. Я у себя создам архив сканов, а в каждой записи базы будет стоять ссылка на лист, с которого производилась оцифровка.
2. Останется также "сырой" (без исправлений) вариант базы.

Прошу проверить список волостей (1914 год):
Прикрепленный файл  Волости_по_уездам.zip   1,2К   22 Количество загрузок:

#144 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 25 февраля 2012 - 02:38

Боюсь, что сырого без исправлений варианта базы уже не останется. Как только этот вопрос возник, я стала сверять все названия волостей и писать их правильно или, если они совсем не соответствуют списку волостей, то ставить знак вопроса (не так много). Я с самого начала старалась исправлять наименования волостей, но только те, которые точно помнила, а потом просто составила список и проверяла все. Учитывая довольно большой объем обработанных мной сканов, вряд ли удастся вернуть их к исходному варианту. Селения, к сожалению, остались, как были, списка их просто не оказалось под рукой.
Но я однозначно считаю, что первичному документу соответствует скан, а в базе данных нельзя оставлять ошибки, по возможности нужно их все исправить.

#145 Евгений Воронин

Евгений Воронин

    Администратор. Совет ЯрИРО

  • Главные администраторы
  • PipPipPipPipPip
  • 5 774 сообщений

Отправлено 25 февраля 2012 - 04:06

Согласен.

#146 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 25 февраля 2012 - 04:30

К сожалению, в сети гуляет много списков волостей Ярославской губернии с самыми различными ошибками. Я скачала список Андрея Владимировича и сравнила с тем, который я ранее составила из сети и не была на 100% уверена в отсутствии ошибок. Небольшие расхождения нашла, оставшиеся у меня листы я скорректировала по предоставленному списку, за исключением Ростовского уезда Сулостской волости, как понимаю, по названию села Сулость. А не Суголосткая вол., как в списке.

#147 Buktop

Buktop

    Ветеран

  • Ветераны
  • PipPipPipPipPip
  • 332 сообщений

Отправлено 25 февраля 2012 - 06:35

Сканы 109-119 готовы.
Перевел все имеющиеся сканы в формат pdf. Теперь можно просмотреть снимки в виде книги, нумерация страниц соответствует номерам сканов в теме.
Вопрос: куда залить или где разместить документ?

#148 MVR

MVR

    Ветеран

  • Ветераны
  • PipPipPipPipPip
  • 1 262 сообщений

Отправлено 25 февраля 2012 - 12:12

Просмотр сообщенияЕлена Дмитриевна (25 февраля 2012 - 02:38) писал:

Я с самого начала старалась исправлять наименования волостей, но только те, которые точно помнила, а потом просто составила список и проверяла все.

Я также поступала - исправляла откровенные ошибки. То, что вызывало сомнения или было нечитаемо, выделяла красным цветом.

#149 Olnika

Olnika

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 1 735 сообщений

Отправлено 25 февраля 2012 - 14:39

Просмотр сообщенияBuktop (25 февраля 2012 - 06:35) писал:

Перевел все имеющиеся сканы в формат pdf. Теперь можно просмотреть снимки в виде книги, нумерация страниц соответствует номерам сканов в теме.
Вопрос: куда залить или где разместить документ?

Виктор, это очень пригодится при работе над ошибками, которые в основном будут в  названиях волостей и деревень. Хорошо бы ссылку на документ сделать.
С мнением Евгения я согласна: надо оставить все записи оригинала, независимо от повторений.

#150 Buktop

Buktop

    Ветеран

  • Ветераны
  • PipPipPipPipPip
  • 332 сообщений

Отправлено 25 февраля 2012 - 14:56

Залил пока сюда: http://files.mail.ru/VEUP7K

#151 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 25 февраля 2012 - 16:20

В объединенной базе 7094 записи.

Скачал pdf, подготовленный Виктором. Теперь у нас есть оригинал, который храниться в удобном для просмотра виде. В базе есть ссылка на номера страниц pdf (для удобства думаю разделить номер страницы и автора).

По поводу сохранения записей-дублей, у меня такое мнение:
Если записи полностью по ВСЕМ полям совпадают, то дубль можно удалить. Зачем хранить то, чему нет применения?
Ведь даже если это два разных человека, то наличие двух записей имело бы смысл только в том случае, если бы:
- мы имели возможность создать полную базу,
- предполагалось расширение информации о людях попавших в базу (дата рождения, информация о родственниках и т.д.)

#152 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 25 февраля 2012 - 16:31

Я скачала списки в pdf и сверила номера страниц в нем со своими. Все совпадает, но отсутствуют последние две страницы, которые я обрабатывала - 197 и 198. в файле всего 196 страниц.

#153 Buktop

Buktop

    Ветеран

  • Ветераны
  • PipPipPipPipPip
  • 332 сообщений

Отправлено 25 февраля 2012 - 16:48

Елена Дмитриевна! В файле действительно 196 страниц, по непонятным мне причинам какие-то два файла продублировались и кроме того на радикале они были отсортированы  в нечисловом порядке. Страница Вашего файла - 120. Что-то не так на радикале...

#154 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 25 февраля 2012 - 16:50

Просмотр сообщенияЕлена Дмитриевна (25 февраля 2012 - 04:30) писал:

К сожалению, в сети гуляет много списков волостей Ярославской губернии с самыми различными ошибками. Я скачала список Андрея Владимировича и сравнила с тем, который я ранее составила из сети и не была на 100% уверена в отсутствии ошибок. Небольшие расхождения нашла, оставшиеся у меня листы я скорректировала по предоставленному списку, за исключением Ростовского уезда Сулостской волости, как понимаю, по названию села Сулость. А не Суголосткая вол., как в списке.

Исправил Суголосткую на Сулостскую волость.

Прикрепленный файл  Волости_по_уездам.zip   1,2К   22 Количество загрузок:

#155 Buktop

Buktop

    Ветеран

  • Ветераны
  • PipPipPipPipPip
  • 332 сообщений

Отправлено 25 февраля 2012 - 16:53

Просмотр сообщенияciandr (25 февраля 2012 - 16:20) писал:

В объединенной базе 7094 записи.

Скачал pdf, подготовленный Виктором. Теперь у нас есть оригинал, который храниться в удобном для просмотра виде. В базе есть ссылка на номера страниц pdf (для удобства думаю разделить номер страницы и автора).

По поводу сохранения записей-дублей, у меня такое мнение:
Если записи полностью по ВСЕМ полям совпадают, то дубль можно удалить. Зачем хранить то, чему нет применения?
Ведь даже если это два разных человека, то наличие двух записей имело бы смысл только в том случае, если бы:
- мы имели возможность создать полную базу,
- предполагалось расширение информации о людях попавших в базу (дата рождения, информация о родственниках и т.д.)

Андрей Владимирович! К сожалению, порядковые номера сканов и номера страниц не соответствуют друг другу. Благодаря Елене Дмитриевне обнаружился этот неприятный факт, хотя на радикал я заливал именно в той последовательности, в которой они идут в pdf. Где проблема - понятия не имею :image049: Но такой казус имеет место.

#156 Olnika

Olnika

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 1 735 сообщений

Отправлено 25 февраля 2012 - 17:02

Елена Дмитриевна, 197 скан соответствует 119 странице файла .pdf, а 198 это 120 страница.
Я первоначально насчитала 198 сканов, а их оказалось 197. Поскольку работа уже началась, скан 137 стала считать несуществующим. Но почему у Виктора 196 стр. в файле .pdf, а у нас 197 сканов, надо разобраться. Понятно ли я наговорила?

#157 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 25 февраля 2012 - 17:04

Просмотр сообщенияBuktop (25 февраля 2012 - 16:53) писал:

Андрей Владимирович! К сожалению, порядковые номера сканов и номера страниц не соответствуют друг другу...

Ничего страшного, главное вовремя заметили. Конечно, самый лучший вариант - если бы на страницах сканов стояли реальные номера страниц и в базе была бы ссылка по этим номерам. Это гарантировало бы 100%-ую сохранность связи базы и исходного материала.
Подумаю, как решить эту проблему.

#158 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 25 февраля 2012 - 17:05

Я осторожна в работе с данными и предпочла бы, чтобы дубли не удалялись, если только они не совсем рядом случились в оригинале. В нашей базе записи, кроме случайных повторов, по определению не могут по всем полям совпадать - ссылки на страницы оригинала разные, даже если по алфавиту записи рядом.
Кроме самой записи, некоторую информацию всегда несет ее окружение. Не уверена, что оно часто будет востребовано для анализа, и все же, зачем вносить искусственные ограничения? Я всегда рассматриваю все соседние записи, а сортировка по алфавиту как раз позволит выявить схожие записи в разных местах оригинала.
Пусть пользователь сам решит, совпадение это или разные люди с одинаковым именем, а последнее я не раз встречала в своих исследованиях в пределах одного села, и не стоит отнимать  у пользователя эту возможность.

#159 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 25 февраля 2012 - 17:20

Просмотр сообщенияBuktop (25 февраля 2012 - 16:53) писал:

Андрей Владимирович! К сожалению, порядковые номера сканов и номера страниц не соответствуют друг другу. Благодаря Елене Дмитриевне обнаружился этот неприятный факт, хотя на радикал я заливал именно в той последовательности, в которой они идут в pdf. Где проблема - понятия не имею. :image049: Но такой казус имеет место.

Виктор, если у Вас сохранилась выборка "необрезанных" (с номерами страниц) сканов по Ярославской губернии, то я мог бы заменить в базе наши виртуальные номера на реальные номера страниц. У реальных номеров есть еще плюс - если при изучении полных Именных списков возникнет подозрение, что какую-то страницу мы не учли при создании базы, то это легко будет проверить.

#160 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 25 февраля 2012 - 17:27

Я проверила все "свои" сканы со 138 по 198, и все номера сканов точно совпадают с номерами страниц в pdf, кроме отсутствующих последних двух сканов 197 и 198.
Если хотите, я проверю все, начиная с первого и выясню ошибку.

#161 Buktop

Buktop

    Ветеран

  • Ветераны
  • PipPipPipPipPip
  • 332 сообщений

Отправлено 25 февраля 2012 - 17:36

Просмотр сообщенияciandr (25 февраля 2012 - 17:20) писал:

Виктор, если у Вас сохранилась выборка "необрезанных" (с номерами страниц) сканов по Ярославской губернии, то я мог бы заменить в базе наши виртуальные номера на реальные номера страниц. У реальных номеров есть еще плюс, если при изучении полных Именных списков возникнет подозрение, что какую-то страницу мы не учли при создании базы, то это легко будет проверить.

Если только делать по новой, но есть одно "но": опять будет невозможно соблюсти тот порядок, в котором я делал эти снимки. Сейчас пытаюсь на радикале проставить номера на сканы в соответствии с номерами страниц. Кстати, файлов и на форуме 196. Посмотрите на первое сообщение - вот какая чехарда номеров страниц :(

#162 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 25 февраля 2012 - 18:12

Все не так страшно, перепутанными оказались только страницы в первом сообщении, в остальных трех они четко соотвествуют той нумерации, которая нам была дана. Я еще раз просчитала и опять насчитала 198 сканов, но я не сильна в арифметике.

Ольга, я пока не совсем поняла то, что Вы написали.
Проверила сканы в сообщениях №№ 2 и 3, нумерация совпадает. Разберемся, не стоит волноваться.

Скан № 197 в радикале соответствует стр. 119 в файле pdf, а скан № 198 - стр. 120. Вероятно, они продублированы, отсюда и возникают 198 сканов. Не стоит торопиться все менять.

#163 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 26 февраля 2012 - 00:13

Обнаружил, что на сканах 26-27 совпадает со сканами 166-167 около 50 фамилий.

Это лишний раз подтверждает, что сохранение дублей не несет никакой дополнительной информации.
Соседние записи ничего не дают, т.к. на указанных выше страницах одни и те же фамилии окружены разными "соседями".
Если даже одинаковые записи соответствовали разным людям, уничтожая такой дубль, мы никакой информации не теряем.
Если два Ивановых Ивана Ивановича из д. Ивановка участвовали в войне, то наличие в базе двух записей не говорит о том, что погибли оба, а одна не говорит, что погиб только один из них. Одна или две записи одинаково достоверно утверждают только то, что один из Ивановых погиб.

#164 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 26 февраля 2012 - 01:30

Цитата

Обнаружил, что на сканах 26-27 совпадает со сканами 166-167 около 50 фамилий.

Да, совпадают, хотя я посмотрела только нескольких. В частности заметила, что фамилии у некоторых написаны по разному, я сравнила сканы: например, Межцев (166) и Межуев (26); Тижелухин (166) и Тяжелухин (26). Это не описка при вводе, а так на сканах. Практически ясно, что это один человек, но какое написание правильное, мы однозначно не знаем. Все-таки я придерживаюсь своего начального мнения - не удалять повторы, по крайней мере сейчас, до апробации.

#165 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 26 февраля 2012 - 02:43

Согласен, пока правим только явные ошибки.
Я сделал в базе отдельно графы - автор и лист, в лист внес номера страниц из pdf.
Удалил дубли записей (листы 119 и 197).
Пересчитал кол-во сканов, выложенных в теме, получилось 196, если был один повтор, то 195. Но в pdf 196 и в базу мне передали 196???
С утра на свежую голову проверю еще раз.

#166 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 26 февраля 2012 - 03:13

Повтора было два: 119=197 и 120=198. Сканы 197 и 198 я делала, с них начинала, а относительно 119 и 120 - не знаю, были они оба обработаны или только один, когда была замечена эта ошибка.

#167 Buktop

Buktop

    Ветеран

  • Ветераны
  • PipPipPipPipPip
  • 332 сообщений

Отправлено 26 февраля 2012 - 03:42

Думаю вот что: самих сканов - 196, то есть тех, что я делал. При размещении на радикале какие-то из них, возможно, продублировались и значит, в таблице они будут явно видны. Значит, дубль можно отследить и  оставить только один. Хуже другое - если мы думали, что сканов 198, то есть вероятность, что два из них могли выпасть из обработки. И скорей всего, ошибка по подсчету сканов - в 4-м сообщении.

#168 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 26 февраля 2012 - 06:39

Как раз в четвертом сообщении все номера сканов совпадают со страницами файла pdf, я проверила. С самого начала я просчитала все сканы, их было 198, я не заподозрила дублирование, поскольку такая цифра давалась на форуме, и я начала обработку с последних номеров - со 198, отсюда и полное совпадение.
В 3-м сообщении я тоже проверила, в нем совпадают номера сканов и страницы файла, кроме последних двух - 119 и 120, они соответствуют 197 и 198, вот здесь-то и произошла ошибка - похоже, вставились повторно эти два скана.
Таким образом, сканы 197 и 198 продублировались, совпав со 119 и 120. Если кто-то обработал 119 и 120, то их можно оставить, а обработанные 197 и 198 исключить, тогда все ссылки будут верны.
Во втором сообщении вроде бы тоже есть совпадение.
Но вот в 1-м сообщении номера сканов и страниц совсем не совпадали, да еще и файл pdf начинается со второй страницы почему-то. Но все это нужно будет утром повторно просмотреть на свежую голову.

#169 Buktop

Buktop

    Ветеран

  • Ветераны
  • PipPipPipPipPip
  • 332 сообщений

Отправлено 26 февраля 2012 - 11:11

Офф.: думал, от перенапряжения с головой непорядок, оказалось, землетрясение  rolleyes.gif

#170 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 26 февраля 2012 - 14:44

Пересчитывал сканы несколько раз, получилось 196 (22+49+48+77), т.к. 195 (предпоследний)=119, то 195.
Но мне было передано 197 оцифрованных страниц, удалил 1 дубль, получилось 196, т.е. где-то еще дубль.

#171 Buktop

Buktop

    Ветеран

  • Ветераны
  • PipPipPipPipPip
  • 332 сообщений

Отправлено 26 февраля 2012 - 14:49

Андрей Владимирович, в любом случае дубль"выплывет", поэтому нет особо смысла на этом заострять внимание.

#172 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 26 февраля 2012 - 15:11

Андрей Владимирович, но если Вам было передано обработанных 197 страниц,  а я передавала страницы со 138 по 198 (61 скан), то легко увидеть по последовательности ссылок в обработанных сканах, какой номер у Вас отсутствует. Вы исправили ситуацию со 119-м и 197-м. но я вчера видела, что совпадают 120 и 198 (по нумерации ссылок в моих страницах). Проверьте, пожалуйста, есть ли у Вас в обработанных сканах ссылка на 120-й. Если нет, то нужно в моем 198-м исправить ссылки на 120.
Со счетом что-то странное, я сама считала несколько раз, потом на Ольга в сообщениях помещала границы номеров по страницам, все совпадало, было 198 (22+49+48+78), в соответствии с этим я и пронумеровала свои сканы при скачивании. Я всегда веду записи при работе, поэтому у меня все записано. Но это хорошо, что границы не сдвинулись, а просто два скана продублировались.

#173 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 26 февраля 2012 - 15:20

Просмотр сообщенияBuktop (26 февраля 2012 - 14:49) писал:

Андрей Владимирович, в любом случае дубль"выплывет", поэтому нет особо смысла на этом заострять внимание.

Виктор, если мы сейчас не удалим дубль, то потом его будет трудно выловить. Я веду редактирование в Excel, придется применять сортировку, а после нее потеряется порядок расположения записей внутри страницы. Будет трудно сравнивать сканы и их текстовые копии.
Кроме того, в pdf, который Вы выложили, сканов 196, а на форуме - 195 (без дубля). Т.е. возможны 2 варианта: в pdf есть дубль или на форум не был выложен какой-то скан.

#174 Елена Дмитриевна

Елена Дмитриевна

    Ветеран

  • Администрация форума
  • PipPipPipPipPip
  • 6 088 сообщений

Отправлено 26 февраля 2012 - 15:21

Проблема не с лишней страницей, это легко исправляется, а в несоответствии номеров сканов 1-22 в первом сообщении (и значит, ссылок на них в обработанных страницах) страницам 1-22 в файле pdf. Я только что посмотрела еще раз - ничего не изменилось, но по номерам, начиная с 23-го,  порядок.

#175 ciandr

ciandr

    Ветеран

  • Пользователи
  • PipPipPipPipPip
  • 5 198 сообщений

Отправлено 26 февраля 2012 - 15:32

Для меня это не проблема, я уже переделал в базе номера до 23, чтобы они соответствовали номерам в pdf.
Но на форуме при подсчете сканов в последней 4-й партии у меня получается 77 а не 78.




Количество пользователей, читающих эту тему: 1

0 пользователей, 1 гостей, 0 анонимных

  Кольцо генеалогических сайтов Всероссийское Генеалогическое Древо
Яндекс цитирования