MetagenomeDB jest biblioteka Pythona przeznaczone do łatwego przechowywania, pobierania i opisywanie metagenomic sekwencje. & Nbsp; MetagenomeDB występować jako warstwy abstrakcji w górnej części bazy danych MongoDB. To zapewnia API do tworzenia i modyfikowania i połączyć dwa rodzaje obiektów, a mianowicie sekwencji i kolekcji:
& Nbsp; * sekwencje (klasy Sequence) może być czyta, kontigów, klony PCR, etc.
& Nbsp; * kolekcje (klasa Collection) reprezentuje zestawy sekwencji; na przykład, odczyty wynikające z sekwencjonowania próbki, contigs zmontowany z zestawu odczytów, biblioteki PCR
Każdy obiekt może być notowane przy użyciu składni słownikowy jak:
# Pierwsze, możemy zaimportować bibliotekę
import MetagenomeDB jak mdb
# Następnie utworzyć nowy obiekt sekwencji z dwóch
# (Obowiązkowe) właściwości, "nazwa" i "sekwencja"
s = mdb.Sequence ({"name": "Mój sekwencji", "sekwencja": "atgc"})
# Obiekt może być teraz odnotowany
Drukuj s ["długość"]
s ["typ"] = "czytać"
# Raz zmienione, obiekt musi być zaangażowana
# Do bazy danych pozostają modyfikacje
s.commit ()
Obiekty typu sekwencji lub Collection mogą być połączone ze sobą w celu reprezentowania różnych metagenomic zestawów danych. Przykłady obejmują, ale nie są ograniczone do:
& Nbsp; * kolekcja czyta wynikające z przebiegu sekwencjonowania (relacji pomiędzy wielu, kolejnych obiektów i jeden Collection)
& Nbsp; * zestaw kontigów wynikających z montażu zestawu czyta (relacja między dwoma obiektami kolekcji)
& Nbsp; * czyta, że są częścią contig (relacja pomiędzy wielu, kolejnych obiektów i jedna sekwencja)
& Nbsp, * sekwencję, która jest zbliżona do innej sekwencji (zależność pomiędzy dwoma sekwencjami obiektów)
& Nbsp; * kolekcja, która jest częścią większego zbioru (relacja między dwoma obiektami kolekcji)
Powoduje to sieć sekwencji i odbioru, które mogą być badane przy użyciu metod przeznaczony; IEG, Collection.list_sequences () Sequence.list_collections () Sequence.list_related_sequences (). Każda z tych metod pozwala na zaawansowanych filtrów przy użyciu składni odpytuje MongoDB:
# Lista wszystkie kolekcje typu 'collection_of_reads "
# Sekwencja "s", należą do
Kolekcje = s.list_collections ({"type": "collection_of_reads"})
# Lista wszystkie sekwencje, które również należą do tych zbiorów
# O długości co najmniej 50 bp
dla c w kolekcjach:
& Nbsp; c.list_sequences druku ({"długość": {"$ gt": 50}})
MetagenomeDB oferuje również zestaw narzędzi wiersza polecenia, aby zaimportować sekwencje nukleotydów, sekwencji białkowych, blast i wyrównania FASTA wyjście algorytmów i plików montażowych ACE. . Inne narzędzia są, aby dodać lub usunąć wiele obiektów lub ich opisywanie
Wymagania :
- Python
Komentarze nie znaleziono