Gene EcSMS35_3888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3888
Symbol	xylA
ID	6145005
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3955601
End bp	3956923
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	50%
IMG OID	641618714
Product	xylose isomerase
Protein accession	YP_001745853
Protein GI	170681343
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2115] Xylose isomerase
TIGRFAM ID	[TIGR02630] xylose isomerase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCCT ATTTTGACCA GCTCGATCGC GTTCGTTATG AAGGCTCAAA ATCCTCAAAC 
CCGTTAGCAT TCCGTCACTA CAATCCCGAC GAACTGGTGT TGGGCAAGCG TATGGAAGAG 
CATTTGCGTT TTGCCGCCTG CTACTGGCAC ACCTTCTGCT GGAACGGGGC GGATATGTTT 
GGTGTGGGGG CGTTTAATCG TCCGTGGCAG CAGCCTGGTG AGGCACTGGC GTTGGCGAAG 
CGTAAAGCAG ATGTCGCATT TGAGTTTTTC CACAAGTTAC ATGTGCCATT TTATTGCTTC 
CACGATGTAG ATGTTTCCCC TGAGGGCGCG TCGTTAAAAG AGTACATCAA TAATTTTGCG 
CAAATGGTTG ATGTCCTGGC AGGCAAGCAA GAAGAGAGCG GCGTGAAGCT GCTGTGGGGA 
ACTGCTAACT GCTTTACAAA CCCTCGCTAT GGCGCGGGTG CGGCGACGAA CCCAGATCCT 
GAAGTCTTCA GTTGGGCGGC AACGCAAGTT GTTACAGCGA TGGAAGCAAC CCATAAATTG 
GGCGGTGAAA ACTATGTCCT GTGGGGTGGT CGTGAAGGTT ACGAAACGCT GTTAAATACC 
GACTTGCGCC AGGAGCGTGA ACAGCTGGGC CGCTTTATGC AGATGGTGGT TGAGCATAAA 
CATAAAATCG GTTTCCAGGG CACGTTGCTT ATCGAACCGA AACCGCAAGA ACCGACCAAA 
CATCAATATG ATTACGATGC TGCGACGGTC TATGGCTTCC TGAAACAGTT TGGTCTGGAA 
AAAGAGATTA AACTGAATAT TGAAGCTAAC CACGCGACGC TGGCAGGTCA CTCTTTCCAT 
CATGAAATAG CCACCGCCAT TGCGCTTGGC CTGTTCGGTT CTGTCGACGC CAACCGTGGC 
GATGCGCAAC TGGGCTGGGA CACCGACCAG TTCCCGAACA GTGTGGAAGA GAATGCGCTG 
GTGATGTATG AAATTCTCAA AGCAGGCGGT TTCACCACCG GTGGTCTGAA CTTCGATGCC 
AAAGTACGTC GTCAAAGTAC TGATAAATAT GATCTGTTTT ACGGTCATAT CGGCGCGATG 
GATACGATGG CGTTGGCGCT GAAAATTGCA GCGCGCATGA TTGAAGATGG CGAGCTGGAT 
AAACGCATCG CGCAGCGTTA TTCCGGCTGG AATAGCGAAT TAGGCCAGCA AATCCTGAAA 
GGCCAAATGT CACTGGCAGA TTTAGCCAAA TATGCTCAGG AACATAATTT GTCTCCGGTG 
CATCAGAGTG GTCGCCAGGA GCAACTGGAA AATCTGGTAA ATCATTATCT GTTCGACAAA 
TAA

Protein sequence

MQAYFDQLDR VRYEGSKSSN PLAFRHYNPD ELVLGKRMEE HLRFAACYWH TFCWNGADMF 
GVGAFNRPWQ QPGEALALAK RKADVAFEFF HKLHVPFYCF HDVDVSPEGA SLKEYINNFA 
QMVDVLAGKQ EESGVKLLWG TANCFTNPRY GAGAATNPDP EVFSWAATQV VTAMEATHKL 
GGENYVLWGG REGYETLLNT DLRQEREQLG RFMQMVVEHK HKIGFQGTLL IEPKPQEPTK 
HQYDYDAATV YGFLKQFGLE KEIKLNIEAN HATLAGHSFH HEIATAIALG LFGSVDANRG 
DAQLGWDTDQ FPNSVEENAL VMYEILKAGG FTTGGLNFDA KVRRQSTDKY DLFYGHIGAM 
DTMALALKIA ARMIEDGELD KRIAQRYSGW NSELGQQILK GQMSLADLAK YAQEHNLSPV 
HQSGRQEQLE NLVNHYLFDK