Gene EcSMS35_3903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3903
Symbol	lyx
ID	6143850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3973155
End bp	3974651
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	57%
IMG OID	641618729
Product	cryptic L-xylulose kinase
Protein accession	YP_001745868
Protein GI	170679902
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.783257
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAT ACTGGCTGGG GTTAGATTGT GGCGGTAGCT GGCTGAAAGC CGGGCTGTAT 
GACCGCGAAG GCCGGGAGGC AGGCGTGCAG CGCCTGCCGC TGTGCGCATT AAGCCCGCAG 
CCAGGCTGGG CAGAGCGCGA TATGGCAGAA CTGTGGCAAT GCTGCATGGC TGTCATTCGC 
ACCCTGCTTA CTCATTCTGG TGTCAGCGGG GAGCAAATAG TGGGTATCGG TATCTCCGCA 
CAGGGAAAGG GCTTGTTTTT GCTGGATAAA AACGACAAGC CGCTCGGGAA TGCTATTTTG 
TCCTCGGACC GCCGGGCGAT GGAAATCGTT CGTCGCTGGC AGGAAGATGG CATCCCGGAA 
AAACTCTACC CGCTGACCCG ACAAACCTTG TGGACCGGGC ATCCGGTGTC GCTGTTACGC 
TGGCTGAAAG AGCACGAACC GGAACGCTAC GCGCAAATTG GCTGCGTAAT GATGACGCAC 
GACTATCTGC GCTGGTGTTT AACCGGCGTC AAAGGTTGCG AAGAGAGCAA TATTTCCGAG 
TCCAACCTCT ACAACATGAG TCTTGAGGAA TATGACCCGT GCCTCACCGA CTGGCTGGGG 
ATCGCTGAAA TCAACCACGC CCTGCCGCCT GTTGTCGGAT CTGCCGAAAT TTGCGGGGAA 
ATCACCGCTC AGACAGCCGC ACTGACCGGT CTGAAAGCGG GTACGCCCGT TGTCGGCGGC 
CTGTTTGATG TGGTTTCCAC CGCACTCTGT GCCGGGATCG AAGACGAATT TACCCTCAAT 
GCGGTGATGG GCACCTGGGC GGTGACCAGC GGCATAACCC GTGGTTTACG TGACGGTGAA 
GCGCATCCGT ATGTCTATGG TCGCTACGTT AACGATGGTC AATTTATCGT TCACGAAGCC 
AGCCCCACCT CTTCCGGCAA CCTCGAATGG TTTACCGCAC AGTGGGGAGA AATCTCGTTT 
GATGAGATTA ACCAGGCCGT TGCCAGCTTG CCGAAGGCCG GGGGCGATCT CTTTTTCCTG 
CCGTTCCTGT ACGGCAGCAA CGCCGGATTG GAGATGACCA GCGGTTTCTA CGGGATGCAG 
GCCATTCATA CCCGCGCACA CCTGTTGCAG GCCATTTATG AAGGCGTGGT GTTCAGCCAT 
ATGACCCATC TCAACCGGAT GCGCGAACGT TTTACTGATG TGCACACCCT GCGCGTCACT 
GGCGGCCCGG CGCATTCCGA TGTCTGGATG CAAATGCTGG CGGACGTCAG CGGTCTGCGT 
ATCGAGCTGC CGCAGGTGGA AGAAACCGGC TGCTTTGGTG CGGCACTTGC CGCCCGCGTC 
GGCACCGGAG TTTATCGCGA TTTCAGCGAA GCCCAACGTG ATTTACAGCA CCCGGTACGC 
ACCCTGCTGC CGGATATGAC CGCACATCAG CTTTACCAAC AAAAATACCA ACGCTATCAG 
CATCTCATTG CCGCACTTGA GGGCTTTCAC GCCCGCATCA AGGAGCACAC ATTATGA

Protein sequence

MTQYWLGLDC GGSWLKAGLY DREGREAGVQ RLPLCALSPQ PGWAERDMAE LWQCCMAVIR 
TLLTHSGVSG EQIVGIGISA QGKGLFLLDK NDKPLGNAIL SSDRRAMEIV RRWQEDGIPE 
KLYPLTRQTL WTGHPVSLLR WLKEHEPERY AQIGCVMMTH DYLRWCLTGV KGCEESNISE 
SNLYNMSLEE YDPCLTDWLG IAEINHALPP VVGSAEICGE ITAQTAALTG LKAGTPVVGG 
LFDVVSTALC AGIEDEFTLN AVMGTWAVTS GITRGLRDGE AHPYVYGRYV NDGQFIVHEA 
SPTSSGNLEW FTAQWGEISF DEINQAVASL PKAGGDLFFL PFLYGSNAGL EMTSGFYGMQ 
AIHTRAHLLQ AIYEGVVFSH MTHLNRMRER FTDVHTLRVT GGPAHSDVWM QMLADVSGLR 
IELPQVEETG CFGAALAARV GTGVYRDFSE AQRDLQHPVR TLLPDMTAHQ LYQQKYQRYQ 
HLIAALEGFH ARIKEHTL