Gene EcDH1_3472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3472
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3725067
End bp	3726296
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	50%
IMG OID
Product	polysaccharide deacetylase
Protein accession	ACX41087
Protein GI	260450665
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACAAAC AAGCTGTTAT TCTCCTGCTG ATGCTGTTTA CCGCAAGTGT CAGTGCCGCG 
TTACCTGCCC GTTATATGCA AACCATCGAA AATGCTGCGG TCTGGGCGCA AATTGGTGAC 
AAGATGGTGA CCGTGGGGAA TATTCGGGCC GGACAAATCA TTGCCGTGGA GCCCACTGCC 
GCAAGTTATT ACGCATTTAA TTTTGGCTTT GGCAAAGGTT TTATCGATAA AGGTCATCTC 
GAGCCGGTTC AGGGGCGACA AAAAGTTGAA GACGGTTTGG GCGACCTCAA CAAGCCGCTG 
AGTAATCAGA ACTTAGTTAC CTGGAAAGAT ACGCCGGTCT ATAACGCGCC GAGTGCGGGA 
AGTGCGCCAT TTGGGGTACT GGCGGACAAT TTGCGCTACC CGATTTTGCA TAAACTGAAA 
GACAGGTTAA ATCAAACCTG GTATCAGATC CGTATTGGCG ATCGACTGGC CTATATCAGC 
GCACTGGATG CCCAACCCGA TAATGGCCTG TCGGTGCTAA CCTATCACCA TATTCTGCGC 
GACGAAGAAA ACACCCGTTT TCGCCATACT TCGACGACCA CATCGGTACG CGCTTTCAAT 
AACCAGATGG CCTGGCTGCG TGACAGGGGA TACGCGACAC TGAGCATGGT GCAGCTGGAA 
GGCTACGTGA AGAATAAGAT CAATCTCCCT GCGCGAGCGG TGGTGATTAC CTTTGATGAT 
GGCCTCAAGT CGGTGAGCCG CTATGCGTAT CCTGTGTTGA AACAATATGG CATGAAGGCG 
ACGGCGTTTA TTGTTACCTC ACGCATCAAA CGTCACCCGC AGAAGTGGAA CCCAAAATCG 
CTGCAATTTA TGAGCGTTTC TGAGCTTAAC GAAATTCGCG ATGTATTTGA TTTCCAGTCA 
CATACCCATT TTTTGCATCG GGTAGATGGT TATCGCCGAC CCATATTACT GAGCCGTAGT 
GAGCACAATA TTCTGTTTGA TTTTGCACGT TCACGCCGCG CTCTGGCGCA ATTTAATCCG 
CATGTCTGGT ATCTTTCGTA TCCGTTTGGC GGATTTAATG ACAACGCCGT GAAGGCAGCA 
AACGATGCCG GATTTCACCT GGCGGTGACA ACCATGAAAG GCAAAGTAAA ACCGGGGGAT 
AATCCGTTGT TACTAAAACG ACTTTATATC TTAAGAACGG ATTCGCTGGA GACGATGTCG 
CGGCTGGTGA GTAACCAGCC GCAGGGATAA

Protein sequence

MYKQAVILLL MLFTASVSAA LPARYMQTIE NAAVWAQIGD KMVTVGNIRA GQIIAVEPTA 
ASYYAFNFGF GKGFIDKGHL EPVQGRQKVE DGLGDLNKPL SNQNLVTWKD TPVYNAPSAG 
SAPFGVLADN LRYPILHKLK DRLNQTWYQI RIGDRLAYIS ALDAQPDNGL SVLTYHHILR 
DEENTRFRHT STTTSVRAFN NQMAWLRDRG YATLSMVQLE GYVKNKINLP ARAVVITFDD 
GLKSVSRYAY PVLKQYGMKA TAFIVTSRIK RHPQKWNPKS LQFMSVSELN EIRDVFDFQS 
HTHFLHRVDG YRRPILLSRS EHNILFDFAR SRRALAQFNP HVWYLSYPFG GFNDNAVKAA 
NDAGFHLAVT TMKGKVKPGD NPLLLKRLYI LRTDSLETMS RLVSNQPQG