Gene Dgeo_2103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2103
Symbol	engA
ID	4058200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	+
Start bp	2211813
End bp	2213138
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	62%
IMG OID	641231142
Product	GTP-binding protein EngA
Protein accession	YP_605566
Protein GI	94986202
COG category	[R] General function prediction only
COG ID	[COG1160] Predicted GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR03594] ribosome-associated GTPase EngA

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAG TCGCGATTGT GGGAAGGCCG AATGTCGGCA AGTCCAGTTT GTTCAATCGC 
CTGGTGGGGC GGCGTGAGGC CGTGGTGGCC GATTTCCCGG GCGTGACGCG GGATGCCAAG 
GAAGGGCTGA TGCTCTACCA CAATCACCGC ATTGTCCTGG TGGATACCGG CGGGCTGTGG 
AGCGGCGACG AGTGGGAACA GGCCATCCGC GAGAAGGCCG AGTGGGCGAT GGAAGGCGCA 
CAAGCGGTGA TCTTTGTGGT GGATCCGCGC GAGGGCCTCA CCGCTGCTGA TTACGAGGTG 
GCCGACTGGC TGCGCCGACT GGGCAAGCCA GTGATTGTGG CCGCCAACAA GATCGACAGC 
CCCAAGCATG ACGTGTATCT GGCCGAGCTG TGGGGCCTGG GTTTCGGCGA TCCAGTGGCA 
ATCAGCGCCG AACACGCCCG CGGACTGGAC GACCTGATGG AGCGCGTGAT GGCGCACCTT 
CCCGCCGACG AGGAGGACGT CCCGGAAGTT GCGCCCATCC GAATCTCTCT GATTGGCCGT 
CCGAATGTGG GCAAGTCCAG CCTGCTGAAC GCCATAACCC AGAGCGAGCG CGCCATTGTC 
GCGGACCAGC CCGGCACCAC CCGCGACAGC CTGGACGTGG AATGGAATTA TGGCGGCCAG 
CGCTTCGTGC TGGTGGATAC GGCGGGCATC CGCAAAAAGC CCGACACCGC CATCGAGGAA 
TACGCCATCC AGCGCAGCGA GGCCGCGATC GAACGCAGCG ATATCATCTG GCTGGTGGTC 
AACGCAACGG AGATCGGTGA CCATGAACTC AAGCTCGCCA ATCTGGCCTA CGACAGCGGC 
AAGCCGGTCA TCGTGGTGGT GAACAAGTGG GATCTGGTGC CCGACGAGGC CCTCAAGCAG 
ACAGAAAAGG AGCTGAACCA GAAGCTTCAC CACATCGCCT ACGCACCGCG CGTGTACACC 
AGTGCGATCA ACGACTACGG CATCCACGAC ATGCTGGCCG AGGCGATGAA ACTCTATGAG 
AAGTGGCAAA GCCGCATTCC CACCGCCGAG CTCAACCGCT GGCTGGAAAT CTGGCAGATG 
CGTCAGGCAG TGCCCAACTT CCACGGCAAG CCCTTGAAGA TGTACTTCAT GACGCAGGTG 
GAAACGGCAC CTCCTACCTT TGCCATCTTC TGCAACCGCG CCGACTTCGT GACCCGTGCC 
TATGAGGGCT TCCTCCAAAA CCGTATTCGT GAGGACCTCG GATTGGCCGG GATTCCGGTC 
AGGCTCAAGT GGAAGGAGAA AGGGCCGTAT AAGAAGGGGA AGAAGGGCGA GGAGGCCGAG 
GCGTAA

Protein sequence

MQKVAIVGRP NVGKSSLFNR LVGRREAVVA DFPGVTRDAK EGLMLYHNHR IVLVDTGGLW 
SGDEWEQAIR EKAEWAMEGA QAVIFVVDPR EGLTAADYEV ADWLRRLGKP VIVAANKIDS 
PKHDVYLAEL WGLGFGDPVA ISAEHARGLD DLMERVMAHL PADEEDVPEV APIRISLIGR 
PNVGKSSLLN AITQSERAIV ADQPGTTRDS LDVEWNYGGQ RFVLVDTAGI RKKPDTAIEE 
YAIQRSEAAI ERSDIIWLVV NATEIGDHEL KLANLAYDSG KPVIVVVNKW DLVPDEALKQ 
TEKELNQKLH HIAYAPRVYT SAINDYGIHD MLAEAMKLYE KWQSRIPTAE LNRWLEIWQM 
RQAVPNFHGK PLKMYFMTQV ETAPPTFAIF CNRADFVTRA YEGFLQNRIR EDLGLAGIPV 
RLKWKEKGPY KKGKKGEEAE A