Gene SAG0471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0471
Symbol	glk
ID	1013274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	484171
End bp	485139
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	41%
IMG OID	637315673
Product	glucokinase
Protein accession	NP_687501
Protein GI	22536650
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGA AATTATTGGG AATTGACCTC GGAGGAACGA CCATTAAATT TGGTATCTTG 
ACGCTTGAGG GAGAAGTACA AGAAAAATGG GCAATTGAGA CCAATACTTT AGAAAACGGA 
AGACATATCG TTTCTGATAT CGTTGAATCT CTCAAACATC GTTTGAGCCT CTATGGATTA 
ACAAAAGATG ACTTTCTCGG TATCGGTATG GGTTCTCCAG GAGCTGTTGA TAGAACTAGT 
AAAACAGTAA CAGGTGCTTT TAATCTAAAT TGGGCTGATA CTCAAGAAGT AGGTTCAGTT 
ATTGAAAAAG AAGTTGGAAT TCCATTTTTT ATTGATAACG ATGCTAATGT TGCAGCACTT 
GGTGAACGCT GGGTAGGTGC TGGTGCCAAT AATCCCGACG TTGTTTTCGT AACCCTCGGA 
ACAGGAGTAG GTGGAGGTGT TATCGCAGAT GGTAACCTCA TCCATGGTGT TGCAGGAGCA 
GGTGGAGAAA TTGGGCATAT GATTGTTGAT CCAGAAAATG GATTTACGTG CACATGTGGT 
AACAAAGGCT GCCTTGAGAC AGTTGCATCA GCGACAGGTG TTGTTAGAGT AGCACGTCAA 
CTCGCAGAAC AATATGAGGG TTCGTCTGCC ATTAAAGCAG CGATTGACAA CGGTGATACT 
GTTACAAGTA AAGATATTTT TATAGCAGCA GAAGATGGGG ATAAATTTGC TAATTCTGTT 
GTTGAACGTG TATCACGTTA CCTTGGACTG GCAGCAGCTA ATATTTCAAA TATTTTAAAC 
CCTGATTCTG TGGTTATTGG TGGCGGTGTC TCAGCAGCAG GTGAATTTTT ACGTAGTCGC 
GTTGAGAAAT ACTTTGTCAC ATTTGCTTTC CCACAAGTTA AAAAGTCAAC TAAAATTAAG 
ATTGCTGAAC TAGGTAATGA TGCTGGTATT ATTGGTGCAG CAAGCTTAGC CAATCAACAA 
GCAAGTTAA

Protein sequence

MSKKLLGIDL GGTTIKFGIL TLEGEVQEKW AIETNTLENG RHIVSDIVES LKHRLSLYGL 
TKDDFLGIGM GSPGAVDRTS KTVTGAFNLN WADTQEVGSV IEKEVGIPFF IDNDANVAAL 
GERWVGAGAN NPDVVFVTLG TGVGGGVIAD GNLIHGVAGA GGEIGHMIVD PENGFTCTCG 
NKGCLETVAS ATGVVRVARQ LAEQYEGSSA IKAAIDNGDT VTSKDIFIAA EDGDKFANSV 
VERVSRYLGL AAANISNILN PDSVVIGGGV SAAGEFLRSR VEKYFVTFAF PQVKKSTKIK 
IAELGNDAGI IGAASLANQQ AS