Gene SeHA_C3997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3997
Symbol
ID	6492343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3874054
End bp	3875550
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	61%
IMG OID	642744098
Product	L-xylulose/3-keto-L-gulonate kinase
Protein accession	YP_002047703
Protein GI	194449029
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	0.970359
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATT ACTGGCTGGG GTTAGATTGT GGTGGGAGTT GGCTAAAAGC CGGGTTGTAC 
GATGGCGCAG GCCGGGAAGT AGCGGTGCAA CGCCTGCCGC TGCACGCTTT AAGCCCGCAG 
CCAGGCTGGG TTGAACGCGA TATGACCGAA CTGTGGCAAC AGTGCGGCTC GGTCATCAGC 
AAACTGCTGG CGCACACGGG GGTGAGCGGC TCACAAATCC GCGGTCTGGG TATTTCCGCT 
CAGGGTAAGG GCCTGTTCCT GTTAGATAAA AGCGATCGGC CATTAGGTAA AGCGATACTC 
TCTTCCGACC GTCGCGCCAT GGAAATTGTC CAGCGCTGGC AAAAAGAAGC GGTTCCGCAA 
AAACTCTACC CGCTGACTCG GCAAACCCTG TGGACCGGGC ATCCGGTCTC CCTTTTACGC 
TGGGTAAAAG AGAATGAGCC GCAGCGCTAC GCGCAGATAG GCTGCGTCAT GATGACGCAT 
GACTATCTGC GCTGGTGCTT AACCGGCGTG AAAGGCTGTG AGGAGAGCAA CATCTCCGAG 
TCCAACCTCT ACAACATGGC GACGGGCCAG TACGACCCGC TTCTGACCGA GTGGCTGGGC 
ATCAGTGAAA TCGACAGCGC GCTGCCCCCC GTGGTGGGTT CAGCCGAAAT CTGCGGGGAG 
ATCACCGCTC AGGCAGCCGC CATCACCGGT CTGGCGGTGG GTACCCCCGT CGTCGGCGGC 
CTGTTTGATG TGGTTTCCAC CGCCCTTTGC GCCGGTATTG AGGATGAATC AACGCTCAAT 
GCGGTGATGG GTACCTGGGC CGTCACCAGC GGCATCGCTC ACGGTCTGCG CGACCATGAG 
GCCCATCCTT ACGTCTATGG CCGCTACGTC AATGACGGGC AGTATATCGT TCACGAAGCC 
AGCCCGACCT CCTCCGGCAA CCTCGAATGG TTTACCGCCC AGTGGGGCGA CCTCTCTTTT 
GACGAGATCA ACCAGGCGGT CGCCAGCCTG CCGAAAGCCG GTAGCGACCT CTTTTTTCTG 
CCGTTTCTCT ACGGCAGCAA TGCCGGGCTG GAGATGACCT GCGGCTTTTA CGGCATGCAG 
GCGCTGCACA CCCGCGCCCA CCTGCTGCAG GCGATTTATG AAGGCGTGGT GTTCAGCCAT 
ATGACCCACC TCAACCGCAT GCGTGAACGC TTTACCGACG TTTGCGCCCT GCGCGTTACC 
GGCGGCCCGG CCCACTCCGA CGTCTGGATG CAGATGCTGG CGGACGTCAG CGGTTTACGC 
ATCGAGCTGC CGCAGGTGGA GGAGACCGGC TGCTTCGGCG CGGCGCTGGC TGCCCGCGTC 
GGCACCGGCG TATATCGCGA TTTCCGCGAG GCCCAACGCG ACCTGCAGCA CCCGGTGCGC 
ACGCTGCTGC CGGACATGAC CGCACACGCC CTCTACCAGC GCAAATACCG CCAATACCAG 
GATTTGATTG AAGCACTACA GGGCTATCAC GCCCGTATTA AGGAGCACGC ATTATGA

Protein sequence

MSNYWLGLDC GGSWLKAGLY DGAGREVAVQ RLPLHALSPQ PGWVERDMTE LWQQCGSVIS 
KLLAHTGVSG SQIRGLGISA QGKGLFLLDK SDRPLGKAIL SSDRRAMEIV QRWQKEAVPQ 
KLYPLTRQTL WTGHPVSLLR WVKENEPQRY AQIGCVMMTH DYLRWCLTGV KGCEESNISE 
SNLYNMATGQ YDPLLTEWLG ISEIDSALPP VVGSAEICGE ITAQAAAITG LAVGTPVVGG 
LFDVVSTALC AGIEDESTLN AVMGTWAVTS GIAHGLRDHE AHPYVYGRYV NDGQYIVHEA 
SPTSSGNLEW FTAQWGDLSF DEINQAVASL PKAGSDLFFL PFLYGSNAGL EMTCGFYGMQ 
ALHTRAHLLQ AIYEGVVFSH MTHLNRMRER FTDVCALRVT GGPAHSDVWM QMLADVSGLR 
IELPQVEETG CFGAALAARV GTGVYRDFRE AQRDLQHPVR TLLPDMTAHA LYQRKYRQYQ 
DLIEALQGYH ARIKEHAL