Gene P9211_10541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_10541
Symbol	glk
ID	5730673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	949451
End bp	950491
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	35%
IMG OID	641285421
Product	putative glucokinase
Protein accession	YP_001550939
Protein GI	159903595
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0837] Glucokinase
TIGRFAM ID	[TIGR00749] glucokinase, proteobacterial type

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.237851
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTTT TAGCAGGTGA TATAGGTGGT ACAAAGACAC TTCTAGGTGT TTATAAAAAT 
GATGGAGCTG TCTGTAAATT ATTTCACAAA CATTATTATT CCAATCATTG GGAAAGTTTC 
GAACAAATAC TTAAAGATTT TATAGCTAAT ATTCCAGAAC GAATTGAGAA GCCAAAGTAT 
GGATGCATAG CTGTTGCAGG TCAGGAAATA GATGGGTCAA TCAGAATGAC CAACCTGCCA 
TGGAAATTAA ATAATGAAAA TTTATGCAAA ATTGCTTTAC TTAAGCAATT GTCCTTAATT 
AATGATTTCT CTGTTTTAGT TTATGGAATA CCATTCTTAA AAGAGACTCA ATATATAAAA 
CTCCAATTAC CCAGGACAAA GCAAAATTGT TTTTCGAAGA AAAACTTTGC AGTTATAGGA 
GCAGGAACTG GTCTTGGCAT CGCAAGAGGT ATTACAACAT CGACAGGTGT CATATCACTT 
CCAAGTGAAG GAGGTCATAA AGAATTTGCA CCGCGAACTC AAAATGAATG GGAACTAACC 
AATTGGCTAA AAGAAGACCT AAAAATAAAT AGAGTTTCTA TAGAAAGAAT AGTTAGCGGA 
ACTGGACTAG GAAATATAGC TCGATGGAGA CTTATGAAAC AAGACTCAAA ATCGCACCCT 
TTAAGGATAA AAGCAGAGAA TTACCCAATT GAAGGAGATA ATGATCTTCC AGAAGAAGTA 
GCTAAATATG CCAAAAATAG TGATCCCATA ATGAATGAAG TATTAAATAT TTGGCTTAGC 
GCCTATGGAT CAGTAATTGG GGATCTAGCT TTACAAGAAC TATGCTATGG AGGCTTATGG 
ATTGGTGGAG GAACTGCTTC AAAGCATCTG GATGGATTCT CTTCGGATAC ATTTAAATCT 
GCGATAAGAA ACAAAGGGAG GTTTTCAAGA TTTATTGATG AACTTCCGAT AATGGCATTA 
ACAGATAAAG AGGTTGGCCT ATTTTGCGCA GCATGCAAAG CTCATTTAAT AGCCGAATCG 
AATGTCAAAC TAGGTACATA A

Protein sequence

MNLLAGDIGG TKTLLGVYKN DGAVCKLFHK HYYSNHWESF EQILKDFIAN IPERIEKPKY 
GCIAVAGQEI DGSIRMTNLP WKLNNENLCK IALLKQLSLI NDFSVLVYGI PFLKETQYIK 
LQLPRTKQNC FSKKNFAVIG AGTGLGIARG ITTSTGVISL PSEGGHKEFA PRTQNEWELT 
NWLKEDLKIN RVSIERIVSG TGLGNIARWR LMKQDSKSHP LRIKAENYPI EGDNDLPEEV 
AKYAKNSDPI MNEVLNIWLS AYGSVIGDLA LQELCYGGLW IGGGTASKHL DGFSSDTFKS 
AIRNKGRFSR FIDELPIMAL TDKEVGLFCA ACKAHLIAES NVKLGT