400 worów zawierających ok. 400 mln ścinków dokumentów zniszczonych przez reżimy… Najnowsza technologia ePuzzler pozwala na wirtualną rekonstrukcję stron podartych nawet na kilkadziesiąt strzępów.
Konferencję o wykorzystywaniu technologii informatycznych w procesie rekonstrukcji zniszczonych materiałów archiwalnych zorganizowali katowicki oddział IPN oraz Biuro Udostępniania i Archiwizacji Dokumentów IPN w Warszawie. Najnowsze osiągnięcia w tej dziedzinie w środę w Katowicach omówili przedstawiciele Instytutu Fraunhofera do spraw Systemów Produkcyjnych i Technik Konstrukcyjnych w Berlinie, realizującego projekt wirtualnej rekonstrukcji akt Stasi, oraz firma MFB MusterFabrik Berlin GmbH, która zajmowała się m.in. restauracją zasobu archiwalnego zniszczonego w 2009 r. Archiwum Miasta Kolonii.
Jan Schneider z Instytutu Fraunhofera w Berlinie przedstawił system ePuzzler, zajmujący się wirtualną rekonstrukcją strzępków dokumentów. To program, który jest w stanie zrekonstruować dokumenty podarte na kilkanaście, kilkadziesiąt strzępów. Instytut pracuje nad 400 worami zawierającymi ok. 400 mln ścinków dokumentów zniszczonych przez reżimy. Do 14 stycznia 2014 r. udało się zrekonstruować 30 tys. pełnych lub niepełnych stron.
Jan Schneider z Instytutu Fraunhofera w Berlinie przedstawia zasady działania systemu ePuzzler Joanna Juroszek /GN Wirtualna rekonstrukcja nie wyklucza jednak pracy człowieka. Najbardziej żmudna część to przygotowywanie strzępów: wygładzenie, rozdzielenie poskładanych elementów, laminowanie, skanowanie awersów i rewersów.
Program ePuzzler klasyfikuje strzępy za względu na ich cechy: zarys kontur, tekstura, kolor. Rozpoznaje także cechy kontekstowe: czy dany materiał został napisany ręcznie, czy jest to maszynopis, czy szkic. Poznaje też charakter pisma. W ten sposób tworzy się pewna układanka: program wybiera części, które najbardziej do siebie pasują, łączy je ze sobą, tworząc awers i rewers dokumentu. Następnie tworzy dokument w postaci PDF, który później jest drukowany.
Czasem jednak automatyczna rekonstrukcja bywa nieskuteczna. Dzieje się to wtedy, gdy program musi zweryfikować fragmenty, przykładowo 3 dokumentów, bardzo do siebie pasujące. W takich przypadkach potrzeba oceny naukowca, który dokonuje ostatecznej weryfikacji.
Technologia ePuzzler wykorzystywana jest do odtworzenia akt reżimów, podczas pracy instytucji zajmujących się bezpieczeństwem publicznym, czy organów śledczych. Kosztowała ok. 5 mln euro.
W Oddziałowym Biurze Udostępniania i Archiwizacji Dokumentów IPN w Katowicach prace nad rekonstrukcją zniszczonych dokumentów z okresu powojennego i PRL odbywają się w nieco innych warunkach.
W 2001 r. trafiło tam 267 worków ewakuacyjnych (o pojemności ok. 120 litrów każdy) zawierających materiały operacyjne SB, pierwotnie przeznaczone do zniszczenia.
Wśród archiwaliów znaleźć można dokumenty powojenne: sprawy przeciwko członkom AK, WiN, KWP, NSZ oraz z lat 70. i 80. XX wieku, dotyczące Solidarności, a także akta osób internowanych. Jest także kilkaset jednostek Teczek Ewidencji Operacyjnej na Księdza (tzw. TEOK).
Do tej pory udało się odzyskać ok. 15 500 jednostek archiwalnych akt spraw operacyjnych i spraw obiektowych, a także akt personalnych i pracy osobowych źródeł informacji oraz ponad 1000 jednostek spraw administracyjnych (w sumie ok. 105 mb).
Ponadto do zasobu włączono ok. 170 mb odtworzonych kart kartotecznych. Do opracowania pozostaje wciąż ok. 20 metrów bieżących materiałów kartotecznych zachowanych w formie ścinków, ok. 55 mb zachowanych w całości akt administracyjnych oraz ok. 60 mb ścinków akt administracyjnych i operacyjnych.