Gene EcE24377A_4061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4061
Symbol	xylA
ID	5586302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4042152
End bp	4043474
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	51%
IMG OID	640927681
Product	xylose isomerase
Protein accession	YP_001465041
Protein GI	157157106
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2115] Xylose isomerase
TIGRFAM ID	[TIGR02630] xylose isomerase

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGCCT ATTTTGACCA GCTCGATCGC GTTCGTTATG AAGGCTCAAA ATCCTCAAAC 
CCGTTAGCAT TCCGTCACTA CAATCCCGAC GAACTGGTGT TGGGTAAGCG TATGGAAGAG 
CACTTGCGTT TTGCCGCCTG CTACTGGCAC ACCTTCTGCT GGAACGGGGC GGACATGTTT 
GGTGTGGGGG CGTTTAATCG TCCGTGGCAG CAGCCTGGTG AGGCACTGGC GTTGGCGAAG 
CGTAAAGCAG ATGTCGCATT TGAGTTTTTC CACAAGTTAC ATGTGCCATT TTATTGCTTC 
CACGATGTGG ATGTTTCCCC TGAGGGCGCG TCGTTAAAAG AGTACATCAA TAATTTTGCG 
CAAATGGTTG ATGTCCTGGC AGCCAAGCAA GAAGAGAGCG GCGTGAAGCT GCTGTGGGGA 
ACCGCTAACT GCTTTACAAA CCCTCGCTAT GGCGCGGGTG CGGCGACGAA CCCAGATCCT 
GAAGTCTTCA GCTGGGCGGC AACGCAAGTT GTTACAGCGA TGGAAGCAAC CCATAAATTG 
GGCGGTGAAA ACTATGTCCT GTGGGGTGGT CGTGAAGGTT ACGAAACGCT GTTAAATACC 
GACTTGCGTC AGGAGCGTGA ACAACTGGGC CGCTTTATGC AGATGGTGGT TGAGCATAAA 
CATAAAATCG GCTTCCAGGG CACGTTGCTT ATCGAACCGA AACCGCAAGA ACCGACTAAA 
CATCAATATG ATTACGATGC CGCGACGGTC TATGGCTTCC TGAAACAGTT TGGTCTGGAA 
AAAGAGATTA AACTGAACAT TGAAGCTAAC CACGCGACGC TGGCAGGTCA CTCTTTCCAT 
CATGAAATAG CCACCGCCAT TGCGCTTGGC CTGTTCGGTT CTGTCGACGC CAACCGTGGC 
GATGCGCAAC TGGGCTGGGA CACCGACCAG TTCCCGAACA GTGTGGAAGA GAATGCGCTG 
GTGATGTATG AAATTCTCAA AGCAGGCGGT TTCACCACCG GTGGTCTGAA CTTCGATGCC 
AAAGTACGTC GTCAAAGTAC TGATAAATAT GATCTGTTTT ACGGTCATAT CGGCGCGATG 
GATACGATGG CACTGGCGCT GAAAATTGCA GCGCGCATGA TTGAAGATGG CGAGCTGGAT 
AAACGCATCG CGCAGCGTTA TTCCGGCTGG AATAGCGAAT TGGGCCAGCA AATCCTGAAA 
GGCCAAATGT CACTGGCAGA TTTAGCCAAA TATGCTCAGG AACATAATTT GTCTCCGGTG 
CATCAGAGTG GTCGCCAGGA GCAACTGGAA AATCTGGTAA ATCATTATCT GTTCGACAAA 
TAA

Protein sequence

MQAYFDQLDR VRYEGSKSSN PLAFRHYNPD ELVLGKRMEE HLRFAACYWH TFCWNGADMF 
GVGAFNRPWQ QPGEALALAK RKADVAFEFF HKLHVPFYCF HDVDVSPEGA SLKEYINNFA 
QMVDVLAAKQ EESGVKLLWG TANCFTNPRY GAGAATNPDP EVFSWAATQV VTAMEATHKL 
GGENYVLWGG REGYETLLNT DLRQEREQLG RFMQMVVEHK HKIGFQGTLL IEPKPQEPTK 
HQYDYDAATV YGFLKQFGLE KEIKLNIEAN HATLAGHSFH HEIATAIALG LFGSVDANRG 
DAQLGWDTDQ FPNSVEENAL VMYEILKAGG FTTGGLNFDA KVRRQSTDKY DLFYGHIGAM 
DTMALALKIA ARMIEDGELD KRIAQRYSGW NSELGQQILK GQMSLADLAK YAQEHNLSPV 
HQSGRQEQLE NLVNHYLFDK