Gene EcHS_A3768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3768
Symbol	xylA
ID	5593479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3758746
End bp	3760068
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	51%
IMG OID	640922882
Product	xylose isomerase
Protein accession	YP_001460360
Protein GI	157163042
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2115] Xylose isomerase
TIGRFAM ID	[TIGR02630] xylose isomerase

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	0.986128
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGCCT ATTTTGACCA GCTCGATCGC GTTCGTTATG AAGGCTCAAA ATCCTCAAAC 
CCGTTAGCAT TCCGTCACTA CAATCCCGAC GAACTGGTGT TGGGTAAGCG TATGGAAGAG 
CACTTGCGTT TTGCCGCCTG CTACTGGCAC ACCTTCTGCT GGAACGGGGC GGATATGTTT 
GGTGTGGGGG CGTTTAATCG TCCGTGGCAG CAGCCTGGTG AGGCACTGGC GTTGGCGAAG 
CGTAAAGCAG ATGTCGCATT TGAGTTTTTC CACAAGTTAC ATGTGCCATT TTATTGCTTC 
CACGATGTGG ATGTTTCCCC TGAGGGCGCG TCGTTAAAAG AGTACATCAA TAATTTTGCG 
CAAATGGTTG ATGTCCTGGC AGGCAAGCAA GAAGAGAGCG GCGTGAAGCT GCTGTGGGGA 
ACCGCCAACT GCTTTACAAA CCCTCGCTAC GGCGCGGGTG CGGCGACGAA CCCAGATCCT 
GAAGTCTTCA GCTGGGCGGC AACGCAAGTT GTTACAGCGA TGGAAGCAAC CCATAAATTG 
GGCGGTGAAA ACTATGTCCT GTGGGGCGGT CGTGAAGGTT ACGAAACGCT GTTAAATACC 
GACTTGCGTC AGGAGCGTGA ACAACTGGGC CGCTTTATGC AGATGGTGGT TGAGCATAAA 
CATAAAATCG GTTTCCAGGG CACGTTGCTT ATCGAACCGA AACCGCAAGA ACCGACCAAA 
CATCAATATG ATTACGATGC CGCGACGGTC TATGGCTTCC TGAAACAGTT TGGTCTGGAA 
AAAGAGATTA AACTGAACAT TGAAGCTAAC CACGCGACGC TGGCAGGTCA CTCTTTCCAT 
CATGAAATAG CCACCGCCAT TGCGCTTGGC CTGTTCGGTT CTGTCGACGC CAACCGTGGC 
GATGCGCAAC TGGGCTGGGA CACCGACCAG TTCCCGAACA GTGTGGAAGA GAATGCGCTG 
GTGATGTATG AAATTCTCAA AGCAGGCGGT TTCACCACCG GTGGTCTGAA CTTCGATGCC 
AAAGTACGTC GTCAAAGTAC TGATAAATAT GATCTGTTTT ACGGTCATAT CGGCGCGATG 
GATACGATGG CACTGGCGCT GAAAATTGCA GCGCGCATGA TTGAAGATGG CGAGCTGGAT 
AAACGCATCG CGCAGCGTTA TTCCGGCTGG AATAGCGAAT TGGGCCAGCA AATCCTGAAA 
GGCCAAATGT CACTGGCAGA TTTAGCCAAA TATGCTCAGG AACATAATTT GTCTCCGGTG 
CATCAGAGTG GTCGCCAGGA GCAACTGGAA AATCTGGTAA ATCATTATCT GTTCGACAAA 
TAA

Protein sequence

MQAYFDQLDR VRYEGSKSSN PLAFRHYNPD ELVLGKRMEE HLRFAACYWH TFCWNGADMF 
GVGAFNRPWQ QPGEALALAK RKADVAFEFF HKLHVPFYCF HDVDVSPEGA SLKEYINNFA 
QMVDVLAGKQ EESGVKLLWG TANCFTNPRY GAGAATNPDP EVFSWAATQV VTAMEATHKL 
GGENYVLWGG REGYETLLNT DLRQEREQLG RFMQMVVEHK HKIGFQGTLL IEPKPQEPTK 
HQYDYDAATV YGFLKQFGLE KEIKLNIEAN HATLAGHSFH HEIATAIALG LFGSVDANRG 
DAQLGWDTDQ FPNSVEENAL VMYEILKAGG FTTGGLNFDA KVRRQSTDKY DLFYGHIGAM 
DTMALALKIA ARMIEDGELD KRIAQRYSGW NSELGQQILK GQMSLADLAK YAQEHNLSPV 
HQSGRQEQLE NLVNHYLFDK