14.12.2017
PL EN
05.10.2017 aktualizacja 05.10.2017

Literaturoznawca w świecie big data

Fot. Fotolia Fot. Fotolia

Nowe technologie dostarczają humanistom interesujących i nieoczywistych narzędzi pracy. O tym, jak mogą one wspomóc analizę tekstów literackich opowiada PAP dr Maciej Maryl z Centrum Humanistyki Cyfrowej, działającego przy Instytucie Badań Literackich PAN.

Mimo powtarzających się pogłosek o kryzysie rynku książki, urósł on w dzisiejszych czasach do gigantycznych rozmiarów. W USA - jednym z największych rynków księgarskich na świecie - w jednym tylko roku wydano ponad 300 tys. nowych książek. Liczba wydawanych tytułów zwiększa się również w Polsce. Według danych Biblioteki Narodowej w 1991 r. w naszym kraju wydano prawie 10,7 tys. książek; w 2016 r. było to już ponad 34 tys. pozycji. Choć są to pozytywne wieści, to istnieje pewna grupa zawodowa, dla której wciąż rosnąca liczba tytułów może stanowić problem. Są nią literaturoznawcy.

"Biorąc pod uwagę aktualny przyrost liczby książek, niemożliwe jest, aby ktoś przeczytał je wszystkie" - mówi PAP dr Maciej Maryl z Centrum Humanistyki Cyfrowej działającego przy Instytucie Badań Literackich PAN. Tradycyjną metodą radzenia sobie z tego typu problemami jest zajmowanie się tylko wybranymi książkami - w tym jednak wypadku badacz świadomie musi rezygnować z ogromnego zasobu potencjalnego materiału.

Do problemu można jednak podejść też z innej strony; umożliwiają to różnego rodzaju nowe technologie. Jak się okazuje, tzw. "humanistyka cyfrowa" może być bardzo cennym narzędziem w rękach literaturoznawcy. Dr Maryl przypomina jednak, że metody stosowane przez "cyfrowych humanistów" mają swoje korzenie w czasach "przedcyfrowych".

"To, co nazywamy dzisiaj humanistyką cyfrową, nie jest w zasadzie rzeczą nową" - podkreśla. - "Metody wykorzystywane w humanistyce cyfrowej istniały już wcześniej, jednak postęp technologiczny, a zwłaszcza postępująca cyfryzacja tekstów kultury, umożliwił w ostatnich latach ich gwałtowny rozwój".

"+Cyfrowość+ humanistyki ma tutaj kilka wymiarów" - kontynuuje badacz. - "Owszem, można ją rozumieć w dosłowny sposób, jako korzystanie z mediów i narzędzi cyfrowych - i w tym ujęciu większość współczesnych badaczy humanistycznych jest już humanistami cyfrowymi". Część z nich idzie jednak o krok dalej, wykorzystując metody cyfrowe do analizy kultury i jej wytworów.

Przykładem takiego podejścia jest stylometria, najszybciej się dziś rozwijająca gałąź filologii cyfrowej, w której rozwój znaczący wkład mają polscy badacze: dr hab. Maciej Eder i dr Jan Rybicki. "Chodzi tutaj o badanie stylu autora tekstu - ale nie w znaczeniu pięknego języka" - opowiada dr Maryl. - "Chodzi tu o ilościowe badanie tekstów, które pozwala dowieść np. ich autorstwa" - wyjaśnia. Dokonuje się tego za pomocą porównywania najczęściej używanych w tekście słów. Jak się okazuje, na tej właśnie podstawie można z dużym prawdopodobieństwem dowieść, kto dany tekst stworzył.

Zastosowania stylometrii dawno już wyszły zresztą poza teorię. Dzisiaj najlepsi specjaliści w tej dziedzinie stosują swoją wiedzę w walce z terroryzmem, analizując np. korespondencję osób podejrzanych.

Jako inny przykład wykorzystania możliwości tworzonych przez nowoczesne technologie rozmówca PAP podaje książkę "The Bestseller Code" Matthew Jockersa i Jodie Archer. "Za pomocą metod makroanalitycznych analizują oni bestsellery rynku wydawniczego" - tłumaczy dr Maryl. - "Tym sposobem próbują określić cechy współczesnego bestsellera na ogromnej próbie 5 tysięcy powieści i sprawdzić czego ludzie mogą w nich poszukiwać. Takie badania mogą być bardzo cenną informacją dla poszukujących nowych tytułów wydawnictw" - dodaje.

Tego typu podejście określane jest przez badaczy literatury jako "distant reading", co można przetłumaczyć jako "czytanie z daleka". "To spojrzenie +z góry+ na dużą ilość tekstu. Zaletą tego podejścia jest to, że możemy pracować ze wszystkimi dostępnymi tekstami i analizować ich język, tematykę czy styl" - tłumaczy rozmówca PAP.

Aby jednak umożliwić zainteresowanym badaczom "czytanie z daleka", niezbędne jest opracowanie w formie cyfrowej ogromnych baz danych. Między innymi temu służy projekt "Polska Bibliografia Literacka - laboratorium wiedzy o współczesnej kulturze polskiej", realizowany w Centrum Humanistyki Cyfrowej ze środków Narodowego Programu Rozwoju Humanistyki. W jego ramach tworzona jest kompletna baza bibliograficzna, która docelowo ma objąć literaturę i sztuki pokrewne z lat 1939–2002.

"Te informacje i ich powiązania same w sobie nic nam nie powiedzą - ale mogą posłużyć za podstawę przy badaniu i interpretacji funkcjonowania tekstów w naszej kulturze" - stwierdza dr Maryl. - "Metody humanistyki cyfrowej znacznie rozszerzają nasz badawczy punkt widzenia" - mówi.

W nadchodzącym roku akademickim dr Maryl będzie kontynuować swoje badania w Stanford Literary Lab - jednym z najważniejszych ośrodków cyfrowych badań filologicznych - przy Stanford University (USA). W ramach prestiżowego stypendium Polsko-Amerykańskiej Komisji Fulbrighta będzie tam realizował projekt zatytułowany "Przełom literacki widziany z góry. Ilościowa historia literatury polskiej (1989-2000)".

"Za pomocą narzędzi, którymi posługują się badacze ze Stanford Literary Lab, chcę spróbować zobaczyć, czy opinie badaczy dotyczące procesów zachodzących w tym okresie w polskim życiu literackim znajdują swoje odzwierciedlenie w danych" - tłumaczy rozmówca PAP. - "Z wypowiedzi krytyków i badaczy literatury +przełomu+, już na pierwszy rzut oka wyłania się pewna narracja" - zaznacza. Jak wyjaśnia, w przełom roku 1989 Polska wchodzi jako bardzo scentralizowana, zarządzana państwowo kultura. Następnie kultura ta ulega rozproszeniu: w całym kraju otwierają się różne pisemka literackie, wychodzi masa nowych publikacji. Dominująca staje się tematyka polityczna - zagadnienia takie jak państwo i demokracja – czy tematy lokalne.

"Ale i ten stan nie trwa długo - w okolicach 1995 r. punktem odniesienia staje się grupa +klasyków+ - mam tutaj na myśli Szymborską, Miłosza, Herberta, Różewicza. Pod koniec dekady zaczynamy z kolei zmierzać do kolejnej centralizacji, ale tym razem komercyjnej: duże wydawnictwa wypierają te mniejsze, z braku środków zaczynają też upadać pisma literackie" - przypomina.

Czy tę narrację badaczy literatury da się zrekonstruować za pomocą danych o literaturze? Tego właśnie chce się dowiedzieć dr Maryl. "Obraz, który rekonstruuję, to tak naprawdę tylko pewne tezy interpretacyjne literaturoznawców" - stwierdza. - "Dopiero analiza ilościowa - przeprowadzona na podstawie artykułów z czasopism literaturoznawczych oraz zawartości Polskiej Bibliografii Literackiej - pokaże nam, czy te wrażenia da się potwierdzić danymi" - mówi.

PAP - Nauka w Polsce, Katarzyna Florencka

kflo/ ekr/

Partnerzy

Copyright © Fundacja PAP 2017