18.11.2018
PL EN
23.10.2018 aktualizacja 24.10.2018
Ludwika Tomala
Ludwika Tomala

Powstał białkowy słownik statystyczny ulubionych słów natury

Przeciwciała, fot. Fotolia Przeciwciała, fot. Fotolia

Naukowcy z Warszawy przeanalizowali język, jakim posługuje się natura przy konstruowaniu białek. W ten sposób powstał słownik jej ulubionych i nielubianych 5-literowych "słów". Badania te rzucają światło na ewolucję białek.

W każdej komórce naszego organizmu jest po kilkanaście, a może i po kilkadziesiąt tysięcy rodzajów białek. Każde białko to splątany łańcuszek złożony z aminokwasów. Białko można porównać do zdania. Może się ono składać z 20 rodzajów literek - aminokwasów. Długość zdania może wynosić np. kilkaset czy kilka tysięcy aminokwasowych "liter". Każde zdanie pełni też funkcje. Np. białko hemoglobina zawierałaby w sobie rozkaz: "chwyć tlen i trzymaj, dopóki nie dostaniesz sygnału, a potem chwyć dwutlenek węgla". Naukowcy próbują rozgryźć kod, jaki wybrała ewolucja, by wprawiać życie w ruch. Ciągle jednak jeszcze w ogromnym stopniu jest to dla ludzkości język obcy.

Aby poznać tajniki tego języka, naukowcy na całym świecie, badając organizmy takie jak kury, muszki owocowe, kukurydzę, prątki gruźlicy czy ludzi, sekwencjonują napotykane w ich komórkach białka. Dzięki temu w publicznie dostępnych bazach danych zgromadzonych jest już ponad 100 milionów sekwencji białkowych - białkowych "zdań". To pokaźna baza danych.

Sherlockowi Holmesowi w zrozumieniu zaszyfrowanej dziwnymi znakami wiadomości pomogła w jednym z opowiadań statystyka. W zaszyfrowanym angielskim tekście m.in. wyszukiwał zbitków trzech liter: "the" składających się na bardzo częsty w tym języku przedimek. I szukał innych częstych w języku zależności. Podobnie polscy naukowcy, żeby rozgryźć niezrozumiały dla nich język zaprzęgli do pomocy statystykę.

ZBADAĆ TO, CO NIE ISTNIEJE

Wszystko zaczęło się od tego, że dr hab. Marcin Grynberg z Instytutu Biochemii i Biofizyki PAN postanowił sprawdzić, czy są jakieś kombinacje aminokwasów, które w przyrodzie w ogóle nie są wykorzystywane do produkcji białek. "Zawsze się zastanawiałem, dlaczego biologia bada tylko to, co w przyrodzie jest, a nie też to, czego nie ma" - opowiada w rozmowie z PAP. Biolog z czystej ciekawości chciał wyprodukować takie "zakazane" kawałki białek i sprawdzić, dlaczego natura ich nie lubi. Wcześniejsze badania innych zespołów wskazywały, że nieznane przyrodzie zlepki aminokwasów faktycznie istnieją.

Pomysł spodobał się kilkorgu innym badaczom: dr Annie Muszewskiej, dr Marcie Hoffman-Sommer, prof. Jarosławowi Poznańskiemu, dr hab. Krzysztofowi Pawłowskiemu oraz dr Konradowi Dębskiemu - ale nie tylko. Do udziału w badaniach zaangażował się hobbystycznie Jan Topiński - z wykształcenia filozof, z zawodu - informatyk. Badania prowadzili po godzinach, obok swoich codziennych zajęć, ponieważ agencje grantowe nie chciały na ich pracę przeznaczyć pieniędzy. W badania włączyły się także dwa prywatne podmioty in4mates oraz Fork Systems, które z zamiłowania do nauki i ciekawości wsparły prowadzone prace badawcze.

Badania trwały ponad 3 lata, ale ryzyko się opłaciło. W październiku wyniki badań ukazały się w prestiżowym czasopiśmie "Scientific Reports" (https://www.nature.com/articles/s41598-018-33433-8). A tam ze świecą szukać badań autorstwa całkowicie polskich zespołów.

Naukowcy zebrali dane o wszystkich znanych dotąd białkach z dwóch ogólnoświatowych baz takich danych. Aminokwasy podzielili na fragmenty 5-literowe i zrobili ranking popularności takich zlepków, tzw. pentapeptydów.

"Jeśli potraktować białka jak zdania, to my chcieliśmy badać fragmenty białkowych zdań - słowa, z których się składają. Chcieliśmy sprawdzić, jakich słów przyroda używa najczęściej" - opowiada Jan Topiński.

Możliwych 5-literowych kombinacji 20 aminokwasów jest aż 3,2 miliona. Testowano też fragmenty dwu-, trzy- i czteropeptydowe. Jednak kombinacje składające się z pięciu aminokwasów okazały się na tyle długie, że już pojawiały się ciekawe zależności. Ale na tyle krótkie, że jeszcze łatwe do analizy.

Niestety, nadzieje dr. Grynberga nie ziściły się: okazało się, że nie ma fragmentów "zakazanych przez naturę". Każdy 5-literowy zlepek aminokwasów gdzieś przez przyrodę jest wykorzystywany. Autorzy poprzednich badań donoszący o „zakazanych peptydach” byli więc w błędzie. Wynikało to z tego, że wcześniejsze bazy danych zawierały skromniejszy przegląd różnorodności biologicznej niż te dostępne obecnie.

Badania dały też inne ciekawe efekty. Przygotowano np. statystyczny słownik 5-literowych zlepków peptydów ulubionych przez naturę. "Na pewno nie jest tak, że wszystkie peptydy są równie popularne. Są fragmenty, które setki razy częściej są wykorzystywane w białkach, niż inne" - opowiada PAP inny uczestnik badań, dr hab. Krzysztof Pawłowski z SGGW.

SPOJRZEĆ W PRZESZŁOŚĆ

Naukowiec wyjaśnia, że w statystykach, jakie przygotował wraz z kolegami, odbija się ewolucja białek. Hipotezą naukowców jest to, że współczesne białka powstawały z ewolucji krótkich peptydów. A więc w początkowych fazach życia sekwencje peptydowe były króciutkie. A jednak działały. Takie najpopularniejsze na świecie krótkie białkowe słówka są świetnymi kandydatami na prabiałka.

"Astronomowie, analizując promieniowane docierające ze Wszechświata, mogą zajrzeć w przeszłość i zobaczyć ślady Wielkiego Wybuchu. A my, analizując sekwencję aminokwasów w białkach, jesteśmy w stanie dostrzec ślady starożytnych białek" - porównuje dr Pawłowski.

Do analizy języka "białkowego" wykorzystano numeryczne metody stosowane wcześniej np. do analizy języka. "Gdybyśmy podzielili tekst +Pana Tadeusza+ na ciągi liter o długości po 5 znaków, może i na pierwszy rzut oka nie miałoby to sensu. Ale wbrew pozorom coś istotnego bylibyśmy dzięki temu w stanie zauważyć" - opowiada Jan Topiński. Zwraca uwagę, że jednym z bohaterów jest ksiądz Robak. I ten zlepek pięciu liter "ROBAK" pewnie pojawiałby się w podzielonym na piątki Panu Tadeuszu statystycznie częściej, niż inne, np. składające się z tych samych liter słowo "KORBA". "To by nam dało do myślenia. Do czego akurat ten fragment jest potrzebniejszy niż inne?" - tłumaczy Jan Topiński.

Nawet jeśli więc 5-literowe zlepki nie są całymi słowami używanymi przez naturę, to mogą podpowiadać naukowcom ważne obszary badań - np. to, którym fragmentom których białek warto się przyjrzeć bliżej, skoro tak bardzo upodobała je sobie ewolucja. "Chcemy teraz zrozumieć, w czym te fragmenty są tak dobre, że natura je częściej wybiera" - uśmiecha się dr Grynberg.

Naukowcy ponadto chcieli sprawdzić, czy ewolucja jednakowo działała w całych białkach. Sprawdzali, czy te same sekwencje są popularne w tzw. fragmentach domenowych białek. A inne sekwencje są popularne w tzw. fragmentach niedomenowych. Ewolucja wybrała więc w różnych częściach białek różne drogi. Co również jest nieoczekiwanym wnioskiem naukowców.

"Gdyby wszystkie pentapeptydy występowały w przyrodzie jednakowo często, świat byłby nudny" - podsumowuje dr Krzysztof Pawłowski z SGGW. Ma nadzieję, że dzięki publikacji w "Scientific Reports" łatwiej będzie przekonać komisje grantowe do finansowania dalszych badań zespołu nad językiem białek. Bo pytań, które powstały podczas tego projektu, nie brakuje.

PAP - Nauka w Polsce, Ludwika Tomala

lt/ zan/

Copyright © Fundacja PAP 2018