O projekcie


Projekt pt. „Europejskie Centrum Bioinformatyki i Genomiki” (nr POIR.04.02.00-30-A004/16-02), współfinansowany przez Unię Europejską ze środków Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Inteligentny Rozwój (działanie 4.2. Rozwój nowoczesnej infrastruktury badawczej sektora nauki), realizowany jest przez Instytut Chemii Bioorganicznej Polskiej Akademii Nauk w Poznaniu w konsorcjum z Politechniką Poznańska oraz firmą Centrum Badań DNA sp. z o.o. w Poznaniu. W ramach Projektu powstanie unikatowa infrastruktura o nazwie Genomiczna Mapa Polski (GMP) zawierająca zbiory danych precyzyjnie opisujących zmienność genetyczną mieszkańców Polski oraz zestaw narzędzi informatycznych służących do ich analizy. Ze względu na wielkość populacji Polski GMP zostanie stworzona na podstawie sekwencji ok. 5000 pełnych genomów. W przyszłości GMP ma służyć jako standard wykorzystywany w badaniach genomicznych lub genetycznych prowadzonych na populacji polskiej oraz stanowić genetyczny opis tej populacji, możliwy do wykorzystania w badaniach ogólnoeuropejskich oraz ogólnoświatowych. Jedynymi beneficjentami projektu są Instytut Chemii Bioorganicznej PAN, Politechnika Poznańska oraz społeczeństwo. Wszelkie działania w projekcie prowadzone są z rekomendacją komisji bioetycznych.

Działalność
 




3D-Gen

Genom referencyjny

Zestaw narzędzi bioinformatycznych i baz danych służących do składania i odczytu pełnych sekwencji genomowych mieszkańców Polski

3D-Gen

Mapa Zmienności Genetycznej

Zestaw narzędzi bioinformatycznych i baz danych służących badaniu zmienności genetycznej populacji zamieszkującej na terenie Polski

3D-Gen

Et-Gen

Narzędzie bioinformatyczne do analizy zmienności genetycznej w obrębie oraz pomiędzy niedużymi populacjami (np. mniejszościami etnicznymi zamieszkującymi na terenie Polski lub populacjami archaicznymi)

3D-Gen

Baza Danych

Narzędzie służące do przechowywania i udostępniania heterogenicznych informacji dotyczących osób będących dawcami DNA

3D-Gen

Fen-Gen

Narzędzie bioinformatyczne do analizy powiązań pomiędzy fenotypem a genotypem

3D-Gen

3D-Gen

Narzędzia umożliwiające dwuwymiarową i trójwymiarową wizualizację zmienności genetycznej

Genomika
 

Genom jest instrukcją służącą do stworzenia i utrzymania przy życiu każdego organizmu. Jest on zapisany pod postacią chemicznego kodu zwanego DNA. Wszystkie żyjące organizmy mają genom. Termin genom odnosi się do całkowitego DNA zgromadzonego w jądrze komórkowym tzw. genom jądrowy) oraz w mitochondriach (tzw. genom mitochondrialny).

Genom jądrowy każdego człowieka jest złożony z około 3,200,000,000 par liter w sekwencji DNA i jest zorganizowany w struktury zwane chromosomami (22 diploidalne autosomy oraz 2 allosomy, czyli chromosomy płci X i Y). Występujący w każdej komórce, obok genomu jądrowego, genom mitochondrialny jest znacznie mniejszy i składa się z ok. 16,500 par nukleotydów.
 

Sekwencjonowanie DNA

Istnieje wiele metod oraz urządzeń pozwalających na odczytanie sekwencji genomów (proces tzw. sekwencjonowania). W projekcie GMP DNA jest sekwencjonowane głównie z wykorzystaniem aparatury wiodącej amerykańskiej firmy Illumina. Chociaż jeden genom człowieka może zostać przesekwencjonowane w ok. jeden dzień, sama analiza danych trwa znacznie dłużej.

Urządzenie służące do odczytania sekwencji genomu, nazywane sekwenatorem, nie jest w stanie odczytać w pełni całej sekwencji genomu człowieka. Zamiast tego, sekwencja DNA jest odczytywana w postaci krótkich fragmentów o długości ok. 150 nukleotydów. Każda taka odczytana sekwencja nazywana jest „odczytem”.
 

Bioinformatyka

Proces sekwencjonowania całego genomu dostarcza ogromnych ilości danych, które muszą następnie zostać poddane analizie. Odczytanie z odpowiednią dokładnością tylko jednego pełnego genomu człowieka generuje ok. 80 Gb danych jeszcze przed ich obróbką bioinformatyczną. Dane te w postaci krótkich odczytów sekwencji genomowych muszą w pierwszym etapie zostać poddane procesowi tzw. "mapowania” do genomu. Proces ten polega na odnalezieniu miejsca z którego najprawdopodobniej dany odczytany fragment pochodzi w sekwencji genomowej wzorca genomu człowieka, tzw. „genomu referencyjnego”. Kolejnym etapem analizy bioinformatycznej jest identyfikacja miejsc, w których odczytana sekwencja genomowa dawcy różni się od genomu referencyjnego. Miejsca tych różnic wskazują na występowanie mutacji, które są podstawą różnorodności genetycznej ludzi oraz wszystkich znanych nam istot żywych oraz wirusów. Mutacje występują w kilku odmianach. Najczęstszy typ to tzw. „mutacje pojedynczego nukleotydu”, gdzie w danym miejscu sekwencja genomowa dawcy zawiera inny nukleotyd niż ten obecny w sekwencji genomu referencyjnego.

Cały proces podstawowej obróbki bioinformatycznej jest bardzo wymagający pod względem niezbędnych zasobów infrastruktury informatycznej. Dla przykładu gdyby chcieć wykonać przedstawionej powyżej operacje bioinformatyczne wykorzystując standardowy laptop, czas trwania obliczeń wyniósłby ok. 125 000 godzin, lub inaczej, ponad 14 lat, zajmując ponad 1 petabajt danych (1000 terabajtów), ciągle zakładając, że istnieje tylko 1 oryginalna wersja danych bez żadnych kopii zapasowych.

Dla uczestników
 

Baza Danych

Informacja o badaniu

Fen-Gen

Ankiety uczestników

Kontakt

Współpraca

Partnerzy

Projekt stworzenia Genomicznej Mapy Polski realizowany jest przez konsorcjum ECBiG – Europejskie Centrum Bioinformatyki i Genomiki w składzie:

Jednostki wchodzące w skład konsorcjum ECBiG od lat konsekwentnie rozbudowują unikatowy w skali kraju oraz rozpoznawalny w Europie potencjał naukowy i infrastrukturalny w zakresie wielkoskalowych i wielopoziomowych badań systemów biologicznych.

Najczęściej zadawane pytania

Genomiczna Mapa Polski to zestaw unikatowych baz danych sekwencji genomowych odzwierciedlających genetyczny obraz populacji Polski, a także narzędzi bioinformatycznych do wielkoskalowej analizy genomów, stworzony na podstawie sekwencji około 5000 pełnych genomów pochodzących od dawców z Polski.
Elementy składowe Genomicznej Mapy Polski stanowią:
Genomiczna Mapa Polski to wspólne przedsięwzięcie Instytutu Chemii Bioorganicznej Polskiej Akademii Nauk (ICHB PAN) w Poznaniu, Politechniki Poznańskiej i Centrum Badań DNA sp. z o.o. realizowane w ramach projektu pt. „Europejskie Centrum Bioinformatyki i Genomiki” (nr POIR.04.02.00-30-A004/16-02), współfinansowanego przez Unię Europejską ze środków Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Inteligentny Rozwój (działanie 4.2. Rozwój nowoczesnej infrastruktury badawczej sektora nauki).
Nie, celem projektu pt. „Europejskie Centrum Bioinformatyki i Genomiki” nie jest prowadzenie badań naukowych, w tym badań dotyczących pochodzenia Polaków. Celem tego projektu jest wytworzenie infrastruktury w postaci baz danych i narzędzi bioinformatycznych (zbiorczo nazwanych Genomiczną Mapą Polski), które w przyszłości będą mogły być wykorzystywane w badaniach naukowych i pracach rozwojowych
Genomiczna Mapa Polski stanowić będzie genetyczny opis populacji polskiej możliwy do wykorzystania w badaniach krajowych, ogólnoeuropejskich i ogólnoświatowych. Genomiczna Mapa Polski ma stać się standardem stosowanym w projektach genomicznych i genetycznych prowadzonych dla populacji polskiej, np. w zakresie opracowywania nowoczesnych podejść diagnostycznych i terapeutycznych stosowanych w medycynie spersonalizowanej.
Osoby deklarujące przynależność do danej grupy etnicznej, które wyrażą chęć udziału w projekcie zostaną poproszone o:
  1. wypełnienie ankiety osobowej,
  2. podpisanie zgód na: udział w badaniu i przetwarzanie danych osobowych oraz
  3. oddanie próbki śliny. Zwrotnie, dawca materiału otrzyma wynik analizy haplogrupy Y-DNA i mitichondrialnego DNA, tj. informację na temat pochodzenia w męskiej i żeńskiej linii genetycznej.
Próbka śliny lub krwi uzyskana od dawcy posłuży do izolacji materiału genetycznego (DNA), który następnie zostanie poddany głębokiemu sekwencjonowaniu w celu poznania kompletnej informacji genetycznej dawcy. Próbki śliny/krwi i/lub DNA dawców będą przechowywane przez ICHB PAN i Politechnikę Poznańską. Nie planuje się rutynowego niszczenia materiału genetycznego zgromadzonego w trakcie projektu.
Nie, materiał biologiczny zebrany w ramach niniejszego projektu posłuży jedynie do wygenerowania danych służących stworzeniu Genomicznej Mapy Polski. Wykorzystanie zebranych próbek na potrzeby innych projektów wymagać będzie uzyskania odrębnej zgody dawców.
Wyłącznymi administratorami danych osobowych zebranych w projekcie będą: ICHB PAN oraz Politechnika Poznańska. Dane osobowe uczestników badania będą przechowywane w siedzibie ICHB PAN, przy ul. Noskowskiego 12/14 w Poznaniu oraz w siedzibie Instytutu Informatyki Politechniki Poznańskiej przy ul. Piotrowo 2 w Poznaniu.
Dostęp do baz danych i narzędzi udostępnionych w ramach Genomicznej Mapy Polski będą mogły uzyskać jednostki naukowo-badawcze, podmioty gospodarcze (np. firmy biomedyczne i farmaceutyczne), organizacje pozarządowe oraz użytkownicy indywidualni spoza sektora nauki i gospodarki. Dostęp do Genomicznej Mapy Polski będzie możliwy w ramach współpracy naukowej z ICHB PAN i Politechniką Poznańską lub po wykupieniu licencji użytkownika. O udostępnieniu infrastruktury (w tym danych) decydować będzie Rada Naukowa Konsorcjum, złożona z przedstawicieli członków Konsorcjum (ICHB PAN, Politechniki Poznańskiej, Centrum Badań DNA sp. z o. o.) oraz osób o uznanym autorytecie naukowym spoza Konsorcjum. Rada będzie mogła odmówić zgody na udostępnienie infrastruktury ze względów etycznych oraz bezpieczeństwa.
Próbki uzyskane od dawców będą podlegały procesowi pseudoanonimizacji, który uniemożliwia przypisanie dawcy (z imienia i nazwiska) do próbki/sekwencji bez osobnego klucza, którym dysponować będą ICHB PAN i Politechnika Poznańska. Użytkownicy Genomicznej Mapy Polski będą mieli dostęp jedynie do danych genomowych (sekwencji i zestawień pochodzących z ich analizy) oraz narzędzi bioinformatycznych. Na żadnym etapie użytkownicy Genomicznej Mapy Polski nie uzyskają informacji umożliwiających powiązanie sekwencji genomowej z danymi dawcy.
Wyniki projektu oraz dane powiązane z uzyskanymi wynikami mogą być publikowane, jednakże w procesie tym nie będą ujawniane personalia uczestników projektu (dawców próbek).