Gene EcSMS35_0559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0559
Symbol
ID	6142744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	565854
End bp	566999
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	56%
IMG OID	641615451
Product	glycerate kinase II
Protein accession	YP_001742658
Protein GI	170680619
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1929] Glycerate kinase
TIGRFAM ID	[TIGR00045] glycerate kinase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATTG TCATTGCGCC AGACTCTTTT AAAGAGAGCT TAAGTGCAGA AAAATGTTGT 
CAGGCAATTA AAGCCGGGTT TTCGACCATA TTTCCCGATG CGCACTATAT CTGTTTGCCG 
ATAGCGGATG GCGGCGAAGG GACGGTGGAG GCGATGGTCG CCGCGACGGG CGGTAACATC 
GTGAAGCTTG AAGTCTGCGG GCCGATGGGC GAAAAAGTGA ATGCTTTTTA TGGACTTACC 
GGCGACGGGA AAACGGCAGT GATTGAGATG GCGGCAGCAA GTGGCCTGAT GCTGGTCGCG 
CCTGAAAAGC GTAATCCGTT GCTGGCCTCC AGTTTTGGTA CGGGGGAGTT AATTCGCCAT 
GCGCTGGATA ACGGCATTCG CCATATTATT CTCGGCATTG GCGGCAGTGC GACGGTCGAC 
GGCGGTATGG GCATGGCGCA GGCGCTCGGT GTGCGTTTCC TTGATGCCGA CGGTCAGCCG 
CTGGCGGCTA ACGGCGGCAA TTTAGCGCGG GTGGCAAGTA TTGAGATGAA TGAATGCGAT 
CCGCGTCTGG CGAACTGTCA TATTGAAGTA GCATGTGACG TTGATAACCC GCTGGTAGGG 
GCACGCGGCG CGGCGGCGGT GTTTGGTCCG CAAAAAGGGG CAACGCCGGA AATGGTCGAA 
GAACTGGAAC AGGGGCTGCA AAATTACGCC CGTGTTTTAC AACAGCTAAC TGAAATCAAC 
GTCTGCCAGA TGGCGGGTGG CGGCGCGGCG GGCGGTATGG GCATTGCGGC GGCGGTATTC 
CTCAATGCGG ATATTAAACC GGGTATTGAG ATTGTACTGC GGGCGGTCAA CCTGGAGCAG 
GCGGTGCAGG GTGCAGCGCT GGTGATCACC GGGGAAGGGC GCATCGATTC GCAAACGGCA 
GGTGGTAAAG CGCCGCTGGG CGTGGCGTCG GTGGCGAAGC AGTTTAATGT CCCGGTGATT 
GGGATTGCTG GCGTATTGGG TGATGGCGTG GAAGTGGTGC ACCAGTACGG CATTGACGCG 
GTGTTCAGCA TTTTGCCACG TCTGGCACCT TTAGCCGAAG TGCTCGCCAG CGGTGAAACC 
AATCTCTTCA ACAGCGCACG AAATATTGCC TGCGCCATTA AAATAGGTCA GGGAATTAAA 
AACTGA

Protein sequence

MKIVIAPDSF KESLSAEKCC QAIKAGFSTI FPDAHYICLP IADGGEGTVE AMVAATGGNI 
VKLEVCGPMG EKVNAFYGLT GDGKTAVIEM AAASGLMLVA PEKRNPLLAS SFGTGELIRH 
ALDNGIRHII LGIGGSATVD GGMGMAQALG VRFLDADGQP LAANGGNLAR VASIEMNECD 
PRLANCHIEV ACDVDNPLVG ARGAAAVFGP QKGATPEMVE ELEQGLQNYA RVLQQLTEIN 
VCQMAGGGAA GGMGIAAAVF LNADIKPGIE IVLRAVNLEQ AVQGAALVIT GEGRIDSQTA 
GGKAPLGVAS VAKQFNVPVI GIAGVLGDGV EVVHQYGIDA VFSILPRLAP LAEVLASGET 
NLFNSARNIA CAIKIGQGIK N