Gene EcHS_A3784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3784
Symbol	lyx
ID	5595246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3776387
End bp	3777883
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	57%
IMG OID	640922898
Product	cryptic L-xylulose kinase
Protein accession	YP_001460376
Protein GI	157163058
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAAT ACTGGCTGGG GTTAGATTGT GGCGGTAGCT GGCTGAAAGC CGGGCTGTAT 
GACCGCGAAG GCCGGGAGGC AGGCGTGCAG CGCCTGCCGC TGTGCGCATT AAGCCCGCAG 
CCAGGCTGGG CAGAGCGCGA TATGGCAGAA CTGTGGCAAT GCTGCATGGC TGTCATTCGC 
GCCCTGCTTA CTCATTCTGG TGTTAGCGGG GAACAAATTG TCGGTATCGG CATCTCCGCA 
CAGGGAAAGG GCTTGTTTTT GCTGGATAAA AACGACAAAC CGCTCGGGAA TGCTATTTTG 
TCCTCGGACC GCCGGGCGAT GGAAATCGTT CGTCGCTGGC AGGAAGATGG CATCCCGGAA 
AAACTCTACC CGCTGACCCG ACAAACCTTG TGGACCGGGC ATCCGGTGTC GCTGTTACGC 
TGGCTGAAAG AGCACGAACC AGAACGCTAC GCGCAAATTG GCTGCGTGAT GATGACGCAC 
GACTACCTGC GCTGGTGTTT AACTGGCGTC AAAGGCTGTG AAGAGAGCAA TATTTCCGAG 
TCCAACCTCT ACAACATGAG TCTTGGGGAA TATGACCCGT GCCTCACCGA CTGGCTGGGG 
ATCGCTGAAA TCAATCACGC CCTGCCGCCT GTTGTCGGAT CTGCCGAAAT CTGCGGGGAG 
ATCACCGCTC AGACAGCCGC CCTGACCGGT CTGAAAGCGG GTACGCCCGT TGTTGGCGGC 
CTGTTTGATG TGGTTTCCAC CGCACTCTGC GCCGGGATCG AAGACGAATT TACCCTCAAT 
GCGGTGATGG GGACCTGGGC GGTGACCAGC GGCATAACCC GCGGTTTACG TGACGGTGAA 
GCGCATCCGT ATGTCTATGG TCGCTACGTT AACGATGGTG AATTTATCGT TCACGAAGCC 
AGCCCTACCT CTTCCGGCAA CCTCGAATGG TTTACCGCAC AGTGGGGAGA AATCTCGTTT 
GATGAGATCA ATCAGGCCGT TGCCAGCTTG CCGAAGGCTG GGGGCGATCT CTTTTTCCTG 
CCGTTCCTGT ACGGCAGCAA CGCCGGACTC GAGATGACCA GTGGTTTCTA CGGGATGCAG 
GCCATTCACA CCCGCGCGCA CCTGTTGCAG GCCATCTATG AAGGGGTGGT GTTCAGCCAT 
ATGACCCACC TCAACCGAAT GCGCGAACGT TTTACTGATG TTCACACCCT ACGCGTCACT 
GGCGGCCCGG CGCACTCCGA TGTCTGGATG CAAATGCTGG CGGACGTCAG CGGTCTGCGT 
ATCGAGCTGC CGCAGGTGGA AGAAACCGGC TGCTTTGGTG CGGCCCTTGC CGCCCGCGTC 
GGCACCGGGG TTTATCACAA CTTCAGCGAA GCCCAACGTG ACTTGCGACA CCCGGTGCGC 
ACCCTGCTGC CAGATATGAC CGCCCATCAG CTTTACCAAA AAAAATATCA ACGTTATCAG 
CATCTCATTG CCGCACTTCA GGGCTTTCAC GCCCGCATTA AGGAGCACAC ATTATGA

Protein sequence

MTQYWLGLDC GGSWLKAGLY DREGREAGVQ RLPLCALSPQ PGWAERDMAE LWQCCMAVIR 
ALLTHSGVSG EQIVGIGISA QGKGLFLLDK NDKPLGNAIL SSDRRAMEIV RRWQEDGIPE 
KLYPLTRQTL WTGHPVSLLR WLKEHEPERY AQIGCVMMTH DYLRWCLTGV KGCEESNISE 
SNLYNMSLGE YDPCLTDWLG IAEINHALPP VVGSAEICGE ITAQTAALTG LKAGTPVVGG 
LFDVVSTALC AGIEDEFTLN AVMGTWAVTS GITRGLRDGE AHPYVYGRYV NDGEFIVHEA 
SPTSSGNLEW FTAQWGEISF DEINQAVASL PKAGGDLFFL PFLYGSNAGL EMTSGFYGMQ 
AIHTRAHLLQ AIYEGVVFSH MTHLNRMRER FTDVHTLRVT GGPAHSDVWM QMLADVSGLR 
IELPQVEETG CFGAALAARV GTGVYHNFSE AQRDLRHPVR TLLPDMTAHQ LYQKKYQRYQ 
HLIAALQGFH ARIKEHTL