Gene P9301_06221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_06221
Symbol	glk
ID	4911328
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	549579
End bp	550613
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	32%
IMG OID	640160203
Product	putative glucokinase
Protein accession	YP_001090846
Protein GI	126695960
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0837] Glucokinase
TIGRFAM ID	[TIGR00749] glucokinase, proteobacterial type

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTTC TTGCTTGTGA TTTAGGAGGT ACAAAGGTTC TATTAGGAAT TTTCAAAAAA 
GAAATAAATA ATAATCCGCC TAAGTTAATA TTTAAAAAGA AATATATATC GTCTGATTGG 
GGTTCTTTTG AATTAATCCT AGAAGACTTT ATCAAAAAAG AATGCAAGAA TATTACTCAT 
CCTTCTTCTG CATGTTTCGC TGTAGCTGGT CCTTTATCTA AAAACAACGC AAAAATCGTT 
AACTTGTCAT GGAATATTTC TGGAAATGAT TTACAGAACA AATTTAATTT AAAAAACTGC 
GAGCTAATAA ATGATTTCGC TGTACAAATT TATGGAATAC CTTTTTTAAA AAAAAATCAA 
TATTCTACTA TCCAAAATGG ATCCAATTCT GAAGATACTA ATAATGATTT GCATGTCATT 
GTTGGAGCGG GGACTGGCTT AGGGATTGCA AGAGGAATAA TATCAGGGGA AAAGGTAAAA 
GTTTTAGCTA GTGAAGGTGG TCATGTAGAG TACTCCCCAA AGTCAAAATT AGAATGGGAT 
TTGAAAATTT GGCTTAAGAA TTACCTAAAA GTTGAAAGGA TATCTTGTGA AAGAATTGTT 
AGCGGCACTG GTTTATCAAG AATTGCCGAA TGGAGGCTAA GCAAACCTGA TGCCCAAAAC 
CATCCTTTAC AAAAATATTT AAAAAAAATT AAAATTTTTG ATGCTGCGAG AAAAGAACTA 
CCTGAAAAAA TTTGTAATCT TTCTAAAGAA GGTGATCAGC TAATGATTGA AGTTGAGAGG 
ATTTGGTTAG GCGCTTATGC CTCATTATTG GGAGATGTTG CTCTTCAAGA ATTGTGCTTT 
GGTGGATTAT GGATTTCTGG AGGAACTGCG TCAAAACATT TCAAAAACTT TAAATCAGAC 
TTATTTTTAA AACAATTTTT CGACAAGGGA AGATTAAAAG ATATTCTTAA AACAATACCT 
ATAAAAGTAA TTTTAGATGA AGAGTTTGGA CTTTTTAGTG CAGCCTGCAG AGCAAAAATG 
CTTTTAAAAA CTTAA

Protein sequence

MNFLACDLGG TKVLLGIFKK EINNNPPKLI FKKKYISSDW GSFELILEDF IKKECKNITH 
PSSACFAVAG PLSKNNAKIV NLSWNISGND LQNKFNLKNC ELINDFAVQI YGIPFLKKNQ 
YSTIQNGSNS EDTNNDLHVI VGAGTGLGIA RGIISGEKVK VLASEGGHVE YSPKSKLEWD 
LKIWLKNYLK VERISCERIV SGTGLSRIAE WRLSKPDAQN HPLQKYLKKI KIFDAARKEL 
PEKICNLSKE GDQLMIEVER IWLGAYASLL GDVALQELCF GGLWISGGTA SKHFKNFKSD 
LFLKQFFDKG RLKDILKTIP IKVILDEEFG LFSAACRAKM LLKT