Gene EcDH1_0145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0145
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	152998
End bp	154320
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	51%
IMG OID
Product	xylose isomerase
Protein accession	ACX37839
Protein GI	260447417
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	72
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGCCT ATTTTGACCA GCTCGATCGC GTTCGTTATG AAGGCTCAAA ATCCTCAAAC 
CCGTTAGCAT TCCGTCACTA CAATCCCGAC GAACTGGTGT TGGGTAAGCG TATGGAAGAG 
CACTTGCGTT TTGCCGCCTG CTACTGGCAC ACCTTCTGCT GGAACGGGGC GGATATGTTT 
GGTGTGGGGG CGTTTAATCG TCCGTGGCAG CAGCCTGGTG AGGCACTGGC GTTGGCGAAG 
CGTAAAGCAG ATGTCGCATT TGAGTTTTTC CACAAGTTAC ATGTGCCATT TTATTGCTTC 
CACGATGTGG ATGTTTCCCC TGAGGGCGCG TCGTTAAAAG AGTACATCAA TAATTTTGCG 
CAAATGGTTG ATGTCCTGGC AGGCAAGCAA GAAGAGAGCG GCGTGAAGCT GCTGTGGGGA 
ACGGCCAACT GCTTTACAAA CCCTCGCTAC GGCGCGGGTG CGGCGACGAA CCCAGATCCT 
GAAGTCTTCA GCTGGGCGGC AACGCAAGTT GTTACAGCGA TGGAAGCAAC CCATAAATTG 
GGCGGTGAAA ACTATGTCCT GTGGGGCGGT CGTGAAGGTT ACGAAACGCT GTTAAATACC 
GACTTGCGTC AGGAGCGTGA ACAACTGGGC CGCTTTATGC AGATGGTGGT TGAGCATAAA 
CATAAAATCG GTTTCCAGGG CACGTTGCTT ATCGAACCGA AACCGCAAGA ACCGACCAAA 
CATCAATATG ATTACGATGC CGCGACGGTC TATGGCTTCC TGAAACAGTT TGGTCTGGAA 
AAAGAGATTA AACTGAACAT TGAAGCTAAC CACGCGACGC TGGCAGGTCA CTCTTTCCAT 
CATGAAATAG CCACCGCCAT TGCGCTTGGC CTGTTCGGTT CTGTCGACGC CAACCGTGGC 
GATGCGCAAC TGGGCTGGGA CACCGACCAG TTCCCGAACA GTGTGGAAGA GAATGCGCTG 
GTGATGTATG AAATTCTCAA AGCAGGCGGT TTCACCACCG GTGGTCTGAA CTTCGATGCC 
AAAGTACGTC GTCAAAGTAC TGATAAATAT GATCTGTTTT ACGGTCATAT CGGCGCGATG 
GATACGATGG CACTGGCGCT GAAAATTGCA GCGCGCATGA TTGAAGATGG CGAGCTGGAT 
AAACGCATCG CGCAGCGTTA TTCCGGCTGG AATAGCGAAT TGGGCCAGCA AATCCTGAAA 
GGCCAAATGT CACTGGCAGA TTTAGCCAAA TATGCTCAGG AACATCATTT GTCTCCGGTG 
CATCAGAGTG GTCGCCAGGA ACAACTGGAA AATCTGGTAA ACCATTATCT GTTCGACAAA 
TAA

Protein sequence

MQAYFDQLDR VRYEGSKSSN PLAFRHYNPD ELVLGKRMEE HLRFAACYWH TFCWNGADMF 
GVGAFNRPWQ QPGEALALAK RKADVAFEFF HKLHVPFYCF HDVDVSPEGA SLKEYINNFA 
QMVDVLAGKQ EESGVKLLWG TANCFTNPRY GAGAATNPDP EVFSWAATQV VTAMEATHKL 
GGENYVLWGG REGYETLLNT DLRQEREQLG RFMQMVVEHK HKIGFQGTLL IEPKPQEPTK 
HQYDYDAATV YGFLKQFGLE KEIKLNIEAN HATLAGHSFH HEIATAIALG LFGSVDANRG 
DAQLGWDTDQ FPNSVEENAL VMYEILKAGG FTTGGLNFDA KVRRQSTDKY DLFYGHIGAM 
DTMALALKIA ARMIEDGELD KRIAQRYSGW NSELGQQILK GQMSLADLAK YAQEHHLSPV 
HQSGRQEQLE NLVNHYLFDK