Gene EcSMS35_4863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4863
Symbol	gcxK
ID	6146453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4972272
End bp	4973414
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	51%
IMG OID	641619667
Product	glycerate kinase GcxK
Protein accession	YP_001746774
Protein GI	170682944
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1929] Glycerate kinase
TIGRFAM ID	[TIGR00045] glycerate kinase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.432659
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.859759
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATAG TTATCTCCCC CGACTCCTTT AAAGAATGCC TTCCCGCATG GAAAGTCGCC 
GAAGCGCTGG CAACCGGCTG GCGCAAGGTC CTGCCTGGCA GCCAACTGGT GTGTTTGCCC 
GTGGCTGACG GCGGCGAAGG CACGCTCGAA ACACTCATTC ATGCGACTGA CGGTACGTTT 
TACACTAAAA AAGTCACCGG ACCGCTTGGC GAATCAATAC ATGCGCAATA CGGTATTTTA 
GGCAACCAAA CCACCGCAGT GATAGAACTG GCACAAGCTT CAGGGCTGGA ACTGGTTTCT 
CCTGTCCAGC GTTCTCCCCT TTATACGACG TCGTTTGGCA CTGGCGAACT TATTCTCGCC 
GCCCTGGAAC ACAATATTGA TACCGTTATT CTATGCCTGG GTGGCAGTGC TACAAATGAT 
GGCGGTATTG GGTTGATGTC GGCACTTGGC GCATCGTTTA CAGACGCCGA AGGGCTATCA 
GTCTCTGTTA ATGGGATGGG GCTGGCGGCA ATTCACCACA TTGACTTACA GCACCTCGAT 
CCACGATTGA AAAATGTGAA ATTTATTGCA GCCTGTGATG TCACCAACCC ACTAACCGGC 
GATAACGGCG CGACTCGGGT TTTTGCTCAA CAAAAAGGGG CCAGTGCTGA CAACCTTGAG 
CAACTGGAAC AGGGAATGAA AAACTATGCC CGTTGCATCT ACCGTTGTTG TGGTAAAGAA 
GTCGATACGA TACCCGGTTC TGGGGCGGCT GGCGGCGTTG GCGCGGCCTT GATGGCTTTT 
CTCGATGCTC GCTTACAACC GGGTATTTCG CTCGTGCTGG AAGCGATTCA ATATACCCAA 
CATTTAAAAT ATGCAGCATT GGCGATTGTC GGTGAAGGTA AATTAGACCG TCAAAGCCTG 
AATGGCAAAG CACCTGTGGG GGCGGCCAAA ATCGCCCAGA TGATGGGCGT TCCGGTTATC 
GCAATTGCCG GGTATATCGA TGATCAACTT GATTTGAATG AGTTACGCCA GTGTGGAATC 
GAAGCCTGTT TTTCCGTCGT CAATGGTCCT TGTGATTTAC CCACCGCGCT GAGTCAGGGG 
GAAAATAATT TAATTCGTCT CGGAGAAAAT TTGGCAGGGT ATTTTCATGC AGTCCTGAGT 
TAA

Protein sequence

MKIVISPDSF KECLPAWKVA EALATGWRKV LPGSQLVCLP VADGGEGTLE TLIHATDGTF 
YTKKVTGPLG ESIHAQYGIL GNQTTAVIEL AQASGLELVS PVQRSPLYTT SFGTGELILA 
ALEHNIDTVI LCLGGSATND GGIGLMSALG ASFTDAEGLS VSVNGMGLAA IHHIDLQHLD 
PRLKNVKFIA ACDVTNPLTG DNGATRVFAQ QKGASADNLE QLEQGMKNYA RCIYRCCGKE 
VDTIPGSGAA GGVGAALMAF LDARLQPGIS LVLEAIQYTQ HLKYAALAIV GEGKLDRQSL 
NGKAPVGAAK IAQMMGVPVI AIAGYIDDQL DLNELRQCGI EACFSVVNGP CDLPTALSQG 
ENNLIRLGEN LAGYFHAVLS