Gene EcDH1_3442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3442
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3690623
End bp	3692140
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	48%
IMG OID
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	ACX41057
Protein GI	260450635
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACAGA TTGATTTCCG AAAAAAAATA AACTGGCATC GTCGTTACCG TTCACCGCAG 
GGCGTTAAAA CCGAACATGA GATCCTGCGG ATCTTCGAGA GCGATCGCGG GCGTATCATC 
AACTCTCCGG CAATTCGTCG TCTGCAACAA AAGACCCAGG TTTTTCCACT GGAGCGCAAT 
GCCGCCGTGC GCACGCGTCT TACCCACTCG ATGGAAGTCC AGCAGGTGGG GCGCTACATC 
GCCAAAGAAA TTTTAAGCCG TCTGAAAGAG CTTAAATTAC TGGAAGCATA CGGCCTGGAT 
GAACTGACCG GTCCCTTTGA AAGCATTGTT GAGATGTCAT GCCTGATGCA CGATATCGGC 
AATCCGCCGT TTGGTCATTT TGGCGAAGCG GCGATAAATG ACTGGTTTCG CCAACGTTTG 
CACCCGGAAG ATGCCGAAAG CCAGCCTCTG ACTGACGATC GCTGCAGCGT GGCGGCACTA 
CGTTTACGGG ACGGGGAAGA ACCGCTTAAC GAGCTGCGGC GCAAGATTCG TCAGGACTTA 
TGTCATTTTG AGGGGAATGC ACAAGGCATT CGCCTGGTGC ATACATTGAT GCGGATGAAT 
CTCACCTGGG CACAGGTTGG CGGTATTTTA AAATATACCC GTCCGGCGTG GTGGCGTGGC 
GAAACGCCTG AGACACATCA CTATTTAATG AAAAAGCCGG GTTATTATCT TTCTGAAGAA 
GCCTATATTG CCCGGTTGCG TAAAGAACTT AATTTGGCGC TTTACAGTCG TTTTCCATTA 
ACGTGGATTA TGGAAGCTGC CGACGACATC TCCTATTGTG TGGCAGACCT TGAAGATGCG 
GTAGAGAAAA GAATATTTAC CGTTGAGCAG CTTTATCATC ATTTGCACGA AGCGTGGGGC 
CAGCATGAGA AAGGTTCGCT CTTTTCGCTG GTGGTTGAAA ATGCCTGGGA AAAATCACGC 
TCAAATAGTT TAAGCCGCAG TACGGAAGAT CAGTTTTTTA TGTATTTACG GGTAAACACC 
CTAAATAAAC TGGTACCCTA CGCGGCACAA CGATTTATTG ATAATCTGCC TGCGATTTTC 
GCCGGAACGT TTAATCATGC ATTATTGGAA GATGCCAGCG AATGCAGCGA TCTTCTTAAG 
CTATATAAAA ATGTCGCTGT AAAACATGTG TTTAGCCATC CAGATGTCGA GCGGCTTGAA 
TTGCAGGGCT ATCGGGTCAT TAGCGGATTA TTAGAGATTT ATCGTCCTTT ATTAAGCCTG 
TCGTTATCAG ACTTTACTGA ACTGGTAGAA AAAGAACGGG TGAAACGTTT CCCTATTGAA 
TCGCGCTTAT TCCACAAACT CTCGACGCGC CATCGGCTGG CCTATGTCGA GGCTGTCAGT 
AAATTACCGT CAGATTCTCC TGAGTTTCCG CTATGGGAAT ATTATTACCG TTGCCGCCTG 
CTGCAGGATT ATATCAGCGG TATGACCGAC CTCTATGCGT GGGATGAATA CCGACGTCTG 
ATGGCCGTAG AACAATAA

Protein sequence

MAQIDFRKKI NWHRRYRSPQ GVKTEHEILR IFESDRGRII NSPAIRRLQQ KTQVFPLERN 
AAVRTRLTHS MEVQQVGRYI AKEILSRLKE LKLLEAYGLD ELTGPFESIV EMSCLMHDIG 
NPPFGHFGEA AINDWFRQRL HPEDAESQPL TDDRCSVAAL RLRDGEEPLN ELRRKIRQDL 
CHFEGNAQGI RLVHTLMRMN LTWAQVGGIL KYTRPAWWRG ETPETHHYLM KKPGYYLSEE 
AYIARLRKEL NLALYSRFPL TWIMEAADDI SYCVADLEDA VEKRIFTVEQ LYHHLHEAWG 
QHEKGSLFSL VVENAWEKSR SNSLSRSTED QFFMYLRVNT LNKLVPYAAQ RFIDNLPAIF 
AGTFNHALLE DASECSDLLK LYKNVAVKHV FSHPDVERLE LQGYRVISGL LEIYRPLLSL 
SLSDFTELVE KERVKRFPIE SRLFHKLSTR HRLAYVEAVS KLPSDSPEFP LWEYYYRCRL 
LQDYISGMTD LYAWDEYRRL MAVEQ