Gene EcDH1_4246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_4246
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	4610768
End bp	4612180
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	49%
IMG OID
Product	glycoside hydrolase family 1
Protein accession	ACX41844
Protein GI	260451422
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCAT TTCCAGAAAC ATTTCTTTGG GGTGGCGCAA CAGCTGCCAA TCAGGTGGAA 
GGTGCCTGGC AGGAAGATGG CAAAGGGATC TCGACCTCAG ATTTACAGCC TCATGGCGTA 
ATGGGAAAAA TGGAACCGCG CATCCTGGGG AAAGAGAATA TCAAAGATGT CGCCATCGAT 
TTTTATCACC GTTACCCGGA AGATATCGCG TTATTTGCCG AGATGGGCTT CACCTGTCTG 
CGTATTTCCA TTGCCTGGGC GCGAATTTTC CCTCAGGGCG ACGAAGTCGA ACCGAATGAA 
GCGGGGTTAG CGTTTTACGA TCGGCTGTTT GATGAAATGG CGCAGGCGGG GATCAAGCCG 
CTGGTAACGT TATCCCATTA CGAAATGCCA TATGGGCTGG TGAAAAACTA CGGCGGTTGG 
GCTAATCGAG CGGTCATCGA TCACTTCGAG CATTACGCCC GCACGGTCTT TACTCGCTAC 
CAACATAAAG TGGCGTTATG GCTGACGTTT AATGAAATCA ACATGTCGTT ACACGCGCCA 
TTCACGGGCG TGGGGCTGGC AGAAGAGAGT GGCGAGGCGG AAGTTTATCA GGCTATCCAC 
CATCAACTGG TTGCCAGTGC GCGGGCAGTT AAAGCCTGTC ATAGCCTGCT CCCCGAAGCG 
AAAATCGGCA ATATGCTTCT CGGTGGGCTG GTTTACCCCC TCACCTGCCA GCCACAGGAT 
ATGTTGCAGG CCATGGAAGA GAACCGGCGC TGGATGTTCT TTGGTGATGT TCAGGCGCGT 
GGCCAGTATC CCGGCTATAT GCAGCGTTTC TTCCGCGACC ACAATATCAC CATTGAGATG 
ACTGAAAGTG ACGCAGAAGA TTTAAAACAT ACCGTCGATT TCATCTCTTT TAGTTATTAC 
ATGACTGGTT GTGTTTCCCA CGACGAAAGC ATTAATAAAA ATGCGCAGGG CAACATACTG 
AATATGATCC CCAATCCGCA TCTGAAAAGT TCAGAGTGGG GGTGGCAAAT TGATCCGGTT 
GGATTACGGG TTCTGTTAAA TACGCTTTGG GATCGTTATC AAAAACCGTT ATTTATTGTC 
GAGAACGGAT TAGGCGCAAA AGACAGCGTT GAAGCGGATG GTTCGATACA GGACGATTAT 
CGAATTGCCT ATTTAAACGA TCACCTGGTA CAGGTAAATG AAGCGATTGC CGATGGTGTG 
GATATTATGG GGTACACCAG TTGGGGGCCA ATTGATTTAG TCAGTGCATC TCATTCACAA 
ATGTCTAAGC GCTACGGCTT TATTTATGTG GATCGTGATG ATAATGGCGA AGGAAGCCTC 
ACAAGAACAC GCAAGAAAAG CTTCGGATGG TATGCAGAGG TGATCAAGAC GCGGGGGCTG 
TCATTAAAAA AAATAACCAT TAAAGCACCT TAA

Protein sequence

MKAFPETFLW GGATAANQVE GAWQEDGKGI STSDLQPHGV MGKMEPRILG KENIKDVAID 
FYHRYPEDIA LFAEMGFTCL RISIAWARIF PQGDEVEPNE AGLAFYDRLF DEMAQAGIKP 
LVTLSHYEMP YGLVKNYGGW ANRAVIDHFE HYARTVFTRY QHKVALWLTF NEINMSLHAP 
FTGVGLAEES GEAEVYQAIH HQLVASARAV KACHSLLPEA KIGNMLLGGL VYPLTCQPQD 
MLQAMEENRR WMFFGDVQAR GQYPGYMQRF FRDHNITIEM TESDAEDLKH TVDFISFSYY 
MTGCVSHDES INKNAQGNIL NMIPNPHLKS SEWGWQIDPV GLRVLLNTLW DRYQKPLFIV 
ENGLGAKDSV EADGSIQDDY RIAYLNDHLV QVNEAIADGV DIMGYTSWGP IDLVSASHSQ 
MSKRYGFIYV DRDDNGEGSL TRTRKKSFGW YAEVIKTRGL SLKKITIKAP