Gene NATL1_06521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_06521
Symbol	glk
ID	4779656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	597149
End bp	598192
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	35%
IMG OID	640083930
Product	putative glucokinase
Protein accession	YP_001014479
Protein GI	124025363
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0837] Glucokinase
TIGRFAM ID	[TIGR00749] glucokinase, proteobacterial type

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTTAC TTGCTGGAGA CCTTGGGGGA ACTAAAACAA TATTAGCTAT TTATTCAAAC 
GAGAACTATC CAAAAAAAAT ATTTGAGAGG TACTATATTT CATCAGAATG GAAATCTTTT 
TACTCATTAT TTGAAGATTT TATTAAACAT TTACCAGATC ATATATCACT GCCTCAATAT 
GGTTCTATTG GTGTAGCCGG GCCAATACAG AATCAGGAGG TTAAGATTAC AAATCTTGGC 
TGGGATATTG AATCAAAAAA GTTATCTCTA CTTTCAAAAA TAAATAATAT TGAATTAATA 
AATGATTTTT CAGTTTTAAT CTATGGAATA CCATTCTTCA ACAGAAACCA ATATGAAGTA 
ATACAAGGGA CATTAAATTC TGATTACAAA AACGATCAAA AATTAATTGC AATTATTGGA 
GCTGGTACTG GCTTAGGAAT GTCCAGAGGC TTGATAACCC CTAAAAGCAT TTCTATATTT 
CCAAGTGAAG GAGGGCATCG AGAATTTTCC CCAAGAACAG AAAACGAATG GGCATTAGTC 
AAATGGCTAA AAAAGAAGTT AAATATTCAA AGAATATCCA TTGAAAGAAT TGTTAGTGGT 
ACTGGCCTTG GCATGATTGC CAGATGGAAA TTGGATGATC CAATAAATGA AAGCCATCCA 
CTTCAGGTAA TTTTAAAAAA TATGGATAGT GACAAATCAG ATTCCACAGA TTTACCCGCA 
CTTGTTTGGG AAAAAGCAAA AAACGGAGAC AAATTAATGA CTGAAGCATT GCAACTATGG 
CTAAATGCTT ATGGGTCTGC AGCTGGAGAC CTTGCTTTAC AAGAACTTTG CTCTTCAGGG 
TTATGGATTT CAGGTGGAAC AGCCGCAAAA AACCTCGATG GAATAAACTC TTCTAACTTC 
CTAAATGCAT TTAGTAATAA GGGTCGCTTT CAATCTTATT TAAAGGAAAT CCCATTGATT 
GTTCTTAAAG ATCCAGAAGC GACATTATTC AGTTCAGCTT GCAGAGCACG CTTAAGTGCC 
GAATCAAATG GGAGACTTAG CTAA

Protein sequence

MNLLAGDLGG TKTILAIYSN ENYPKKIFER YYISSEWKSF YSLFEDFIKH LPDHISLPQY 
GSIGVAGPIQ NQEVKITNLG WDIESKKLSL LSKINNIELI NDFSVLIYGI PFFNRNQYEV 
IQGTLNSDYK NDQKLIAIIG AGTGLGMSRG LITPKSISIF PSEGGHREFS PRTENEWALV 
KWLKKKLNIQ RISIERIVSG TGLGMIARWK LDDPINESHP LQVILKNMDS DKSDSTDLPA 
LVWEKAKNGD KLMTEALQLW LNAYGSAAGD LALQELCSSG LWISGGTAAK NLDGINSSNF 
LNAFSNKGRF QSYLKEIPLI VLKDPEATLF SSACRARLSA ESNGRLS