Strona główna Aktualności
Historia i kultura

Literaturoznawca w świecie big data

05.10.2017 Historia i kultura

Fot. Fotolia

Nowe technologie dostarczają humanistom interesujących i nieoczywistych narzędzi pracy. O tym, jak mogą one wspomóc analizę tekstów literackich opowiada PAP dr Maciej Maryl z Centrum Humanistyki Cyfrowej, działającego przy Instytucie Badań Literackich PAN.

Mimo powtarzających się pogłosek o kryzysie rynku książki, urósł on w dzisiejszych czasach do gigantycznych rozmiarów. W USA - jednym z największych rynków księgarskich na świecie - w jednym tylko roku wydano ponad 300 tys. nowych książek. Liczba wydawanych tytułów zwiększa się również w Polsce. Według danych Biblioteki Narodowej w 1991 r. w naszym kraju wydano prawie 10,7 tys. książek; w 2016 r. było to już ponad 34 tys. pozycji. Choć są to pozytywne wieści, to istnieje pewna grupa zawodowa, dla której wciąż rosnąca liczba tytułów może stanowić problem. Są nią literaturoznawcy.

 

"Biorąc pod uwagę aktualny przyrost liczby książek, niemożliwe jest, aby ktoś przeczytał je wszystkie" - mówi PAP dr Maciej Maryl z Centrum Humanistyki Cyfrowej działającego przy Instytucie Badań Literackich PAN. Tradycyjną metodą radzenia sobie z tego typu problemami jest zajmowanie się tylko wybranymi książkami - w tym jednak wypadku badacz świadomie musi rezygnować z ogromnego zasobu potencjalnego materiału.

 

Do problemu można jednak podejść też z innej strony; umożliwiają to różnego rodzaju nowe technologie. Jak się okazuje, tzw. "humanistyka cyfrowa" może być bardzo cennym narzędziem w rękach literaturoznawcy. Dr Maryl przypomina jednak, że metody stosowane przez "cyfrowych humanistów" mają swoje korzenie w czasach "przedcyfrowych".

 

"To, co nazywamy dzisiaj humanistyką cyfrową, nie jest w zasadzie rzeczą nową" - podkreśla. - "Metody wykorzystywane w humanistyce cyfrowej istniały już wcześniej, jednak postęp technologiczny, a zwłaszcza postępująca cyfryzacja tekstów kultury, umożliwił w ostatnich latach ich gwałtowny rozwój".

 

"+Cyfrowość+ humanistyki ma tutaj kilka wymiarów" - kontynuuje badacz. - "Owszem, można ją rozumieć w dosłowny sposób, jako korzystanie z mediów i narzędzi cyfrowych - i w tym ujęciu większość współczesnych badaczy humanistycznych jest już humanistami cyfrowymi". Część z nich idzie jednak o krok dalej, wykorzystując metody cyfrowe do analizy kultury i jej wytworów.

 

Przykładem takiego podejścia jest stylometria, najszybciej się dziś rozwijająca gałąź filologii cyfrowej, w której rozwój znaczący wkład mają polscy badacze: dr hab. Maciej Eder i dr Jan Rybicki. "Chodzi tutaj o badanie stylu autora tekstu - ale nie w znaczeniu pięknego języka" - opowiada dr Maryl. - "Chodzi tu o ilościowe badanie tekstów, które pozwala dowieść np. ich autorstwa" - wyjaśnia. Dokonuje się tego za pomocą porównywania najczęściej używanych w tekście słów. Jak się okazuje, na tej właśnie podstawie można z dużym prawdopodobieństwem dowieść, kto dany tekst stworzył.

 

Zastosowania stylometrii dawno już wyszły zresztą poza teorię. Dzisiaj najlepsi specjaliści w tej dziedzinie stosują swoją wiedzę w walce z terroryzmem, analizując np. korespondencję osób podejrzanych.

 

Jako inny przykład wykorzystania możliwości tworzonych przez nowoczesne technologie rozmówca PAP podaje książkę "The Bestseller Code" Matthew Jockersa i Jodie Archer. "Za pomocą metod makroanalitycznych analizują oni bestsellery rynku wydawniczego" - tłumaczy dr Maryl. - "Tym sposobem próbują określić cechy współczesnego bestsellera na ogromnej próbie 5 tysięcy powieści i sprawdzić czego ludzie mogą w nich poszukiwać. Takie badania mogą być bardzo cenną informacją dla poszukujących nowych tytułów wydawnictw" - dodaje.

 

Tego typu podejście określane jest przez badaczy literatury jako "distant reading", co można przetłumaczyć jako "czytanie z daleka". "To spojrzenie +z góry+ na dużą ilość tekstu. Zaletą tego podejścia jest to, że możemy pracować ze wszystkimi dostępnymi tekstami i analizować ich język, tematykę czy styl" - tłumaczy rozmówca PAP.

 

Aby jednak umożliwić zainteresowanym badaczom "czytanie z daleka", niezbędne jest opracowanie w formie cyfrowej ogromnych baz danych. Między innymi temu służy projekt "Polska Bibliografia Literacka - laboratorium wiedzy o współczesnej kulturze polskiej", realizowany w Centrum Humanistyki Cyfrowej ze środków Narodowego Programu Rozwoju Humanistyki. W jego ramach tworzona jest kompletna baza bibliograficzna, która docelowo ma objąć literaturę i sztuki pokrewne z lat 1939–2002.

 

"Te informacje i ich powiązania same w sobie nic nam nie powiedzą - ale mogą posłużyć za podstawę przy badaniu i interpretacji funkcjonowania tekstów w naszej kulturze" - stwierdza dr Maryl. - "Metody humanistyki cyfrowej znacznie rozszerzają nasz badawczy punkt widzenia" - mówi.

 

W nadchodzącym roku akademickim dr Maryl będzie kontynuować swoje badania w Stanford Literary Lab - jednym z najważniejszych ośrodków cyfrowych badań filologicznych - przy Stanford University (USA). W ramach prestiżowego stypendium Polsko-Amerykańskiej Komisji Fulbrighta będzie tam realizował projekt zatytułowany "Przełom literacki widziany z góry. Ilościowa historia literatury polskiej (1989-2000)".

 

"Za pomocą narzędzi, którymi posługują się badacze ze Stanford Literary Lab, chcę spróbować zobaczyć, czy opinie badaczy dotyczące procesów zachodzących w tym okresie w polskim życiu literackim znajdują swoje odzwierciedlenie w danych" - tłumaczy rozmówca PAP. - "Z wypowiedzi krytyków i badaczy literatury +przełomu+, już na pierwszy rzut oka wyłania się pewna narracja" - zaznacza. Jak wyjaśnia, w przełom roku 1989 Polska wchodzi jako bardzo scentralizowana, zarządzana państwowo kultura. Następnie kultura ta ulega rozproszeniu: w całym kraju otwierają się różne pisemka literackie, wychodzi masa nowych publikacji. Dominująca staje się tematyka polityczna - zagadnienia takie jak państwo i demokracja – czy tematy lokalne.

 

"Ale i ten stan nie trwa długo - w okolicach 1995 r. punktem odniesienia staje się grupa +klasyków+ - mam tutaj na myśli Szymborską, Miłosza, Herberta, Różewicza. Pod koniec dekady zaczynamy z kolei zmierzać do kolejnej centralizacji, ale tym razem komercyjnej: duże wydawnictwa wypierają te mniejsze, z braku środków zaczynają też upadać pisma literackie" - przypomina.

 

Czy tę narrację badaczy literatury da się zrekonstruować za pomocą danych o literaturze? Tego właśnie chce się dowiedzieć dr Maryl. "Obraz, który rekonstruuję, to tak naprawdę tylko pewne tezy interpretacyjne literaturoznawców" - stwierdza. - "Dopiero analiza ilościowa - przeprowadzona na podstawie artykułów z czasopism literaturoznawczych oraz zawartości Polskiej Bibliografii Literackiej - pokaże nam, czy te wrażenia da się potwierdzić danymi" - mówi.

 

PAP - Nauka w Polsce, Katarzyna Florencka

 

kflo/ ekr/

Podziel się
Ocena: 0 głosów

Logowanie



Nie pamiętam hasła

Rejestracja

Komentarze: 0
Skomentuj Zobacz wszystkie  

Uwaga Redakcje!

Wszelkie materiały PAP (w szczególności depesze, zdjęcia, grafiki, pliki video) zamieszczone w serwisie "Nauka w Polsce" chronione są przepisami ustawy z dnia 4 lutego 1994 r. o prawie autorskim i prawach pokrewnych oraz ustawy z dnia 27 lipca 2001 r. o ochronie baz danych.

 

PAP S.A. zezwala na bezpłatny przedruk artykułów z Serwisu Nauka w Polsce pod warunkiem mailowego poinformowania nas raz w miesiącu o fakcie korzystania z serwisu oraz podania źródła artykułu. W portalach i serwisach internetowych prosimy o zamieszczenie podlinkowanego adresu: Źródło: www.naukawpolsce.pap.pl a w czasopismach adnotacji: Źródło: Serwis Nauka w Polsce - www.naukawpolsce.pap.pl. W przypadku portali społecznościowych prosimy o umieszczenie jedynie tytułu i leadu naszej depeszy z linkiem prowadzącym do treści artykułu na naszej stronie, podobnie jak to jest na naszym profilu facebookowym. 

 

Powyższe zezwolenie nie dotyczy: informacji z kategorii "Świat" oraz wszelkich fotografii i materiałów video.

 

Informacje tekstowe z kategorii "Świat" można pozyskać odpłatnie abonując Serwis Nauka i Zdrowie PAP. Serwis ten zawiera ponadto wiele innych najnowszych doniesień naukowych z zagranicy oraz materiałów dotyczących szeroko rozumianej problematyki zdrowotnej. 

 

Informacje na temat warunków umowy można uzyskać w Dziale Sprzedaży i Obsługi Klienta PAP, tel.: (+48 22) 509 22 25, e-mail:  pap@pap.pl

 

Informacje o przedruku artykułów z Serwisu Nauka w Polsce, prośby o patronaty medialne, informacje o prowadzonych badaniach, organizowanych konferencjach itd., prosimy przesyłać na adres: naukawpolsce@pap.pl

 

 

Najpopularniejsze materiały

więcej

Książka

Tajemnice grzybów - dla niewtajemniczonych Tajemnice grzybów - dla niewtajemniczonych

Czy wiedzieliście, że grzyby można spotkać nawet na pustyniach czy w oceanach? Albo wykorzystać jako... planistów ruchu? Każdy, kto czuje się gotów na wprowadzenie do swojego życia tych i innych ciekawostek okołogrzybowych, powinien sięgnąć po książkę "Tajemnicze życie grzybów".

Więcej

Myśl na dziś

Dobrze zrozumiana nauka chroni człowieka przed pychą, gdyż ukazuje mu jego granice.
Albert Schweitzer

Nasz blog

Tabletka Matuzalema Tabletka Matuzalema

Naukowcy coraz lepiej poznają biologiczne podstawy starzenia; udaje im się nawet wydłużyć życie niektórych organizmów. Według autorów tych dokonań może to zaowocować nowymi terapiami i zwiększeniem liczby przeżywanych w zdrowiu lat. Według innych badań już dziś wiele w tym względzie można zdziałać dietą.

Więcej

Tagi