Gene Emin_0157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0157
Symbol
ID	6263052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	167154
End bp	168272
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	45%
IMG OID	642610621
Product	DNA protecting protein DprA
Protein accession	YP_001875059
Protein GI	187250577
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.835588
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAACAG ATTCGGAAAG ACTTGCCAGA ATAAAATTAA ACGCTTTTAC CTATTTGCGT 
ACGGATTGGG CCATGCGCAT GATAGAAGTT TTTGGCAGCG CGGAAATGAT TTTAAAAACT 
TCAGCTAAGG ATTTGGCGGC GCAGGGCGGA ATGTCGGAAG ATACTGCCGC CAATTTACTT 
AAAGAAGCGC ACGCGCTTGA CGCTGAGAAG GAAGCGGAAC TTACAAATAA AGCGGGCGGC 
AAAATTTTGC TTTTGGAAGA TTATGAGTAT CCCCAAAGTT TAAAAGATAT TAAGGACCCG 
CCTTTTGTTT TATATGTGCG CGGAACATTA GAAGCGCGCG GCCCTAAAGT GGCAATGGTG 
GGCACAAGGC TTATAACGCC TTACGGAAGG AGATGCGCTA AAAAATTTGC CACGGAAATC 
GCGCAGGCGG GATGCGTTGT AGTAAGCGGT TTGGCCCGCG GAGTTGACAG TGTATGCCAG 
CAGGCGGTGG TTGATATTAA TAAACCCACC TGGGCTGTTG TGGGCACTGG AATAGGGCGT 
TGTTACCCGG CTGAAAATAA AGCTTTGGCA AACGCTGTTT TAGAAAACGG CGGCGCCATA 
ATTTCGGAAC TATCTTTTAA TAAACCGCCG AACGCTTTTC ATTTTCCCAG GCGCAACAGA 
ATAATTTCTG CCCTTTCAAG CGTGGTGGTT ATTATAGAAG GTAAAGTGCG CTCAGGCGCT 
TTGATTACGG CAAAACTGGC CGCTGAGCAG GGTAAAGATA TTTTAGCGGT GCCCGGCTCT 
ATAGAAAGCG AACAGAGCGG CGGCCCCAAT ATGTTAATTA AAGACGGCGC GCACGCCTTG 
CTTGAAACGC GCGATATTAT AGACCTTATT CCTTTTGAGG AGCGCTTTGG CCTTAATGAG 
GAAGTTTTTG AAAAAGATTC GGTTCAAAAA GAAATACTTG ATTTAACTGA AACGGAAAAA 
CAATTTTTAG AAGTTATCGG CCCCGGTGAA CATACGATCG ATGATATTGT TGAAGCTTTG 
GCAACGGATG TTCCTTCGGC CGCGGCGGTA TTATTTGAAA TGGAGATTAA AGGCGTTTTA 
ATGTGCAAAG ACGGCAAATA CAGCCGTAAC AATTTTTAA

Protein sequence

MITDSERLAR IKLNAFTYLR TDWAMRMIEV FGSAEMILKT SAKDLAAQGG MSEDTAANLL 
KEAHALDAEK EAELTNKAGG KILLLEDYEY PQSLKDIKDP PFVLYVRGTL EARGPKVAMV 
GTRLITPYGR RCAKKFATEI AQAGCVVVSG LARGVDSVCQ QAVVDINKPT WAVVGTGIGR 
CYPAENKALA NAVLENGGAI ISELSFNKPP NAFHFPRRNR IISALSSVVV IIEGKVRSGA 
LITAKLAAEQ GKDILAVPGS IESEQSGGPN MLIKDGAHAL LETRDIIDLI PFEERFGLNE 
EVFEKDSVQK EILDLTETEK QFLEVIGPGE HTIDDIVEAL ATDVPSAAAV LFEMEIKGVL 
MCKDGKYSRN NF