Gene P9301_18191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_18191
Symbol
ID	4911468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	1539691
End bp	1540689
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	32%
IMG OID	640161423
Product	putative carbohydrate kinase
Protein accession	YP_001092043
Protein GI	126697157
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA AAAAGGTCAT ATGTATTGGA GAGGCTTTAA TTGACAGAAT CAGAAATAAG 
TCTAATCAAG GATTTACAGA TTTTTTAGGT GGGGCCCCAG CGAATGTTGC TTGTGCATTA 
AGAAAATTAA AAATAGATTC AGTATTTATA GGATGTTTGG GTAGTGATGA TTATGGAAAA 
AAATTTATTA CGCAATTTAA TAAATTGGAC GTTAATTTAG ATTTCTTGCA ATTGGATAAT 
GATTCATCTA CTCGCGTAGT TAATGTAGAT AGAGATCAAT TTGGAGAACG TTTTTTTTCG 
GGCTTTGAGG AAAGTTCTTA TTCATGCTTT GCAGACGAAG TTCTTAGTAA GAAATTAATC 
GCAAAACAAA TTTTAAATTT GGAGAAATCT TTTCTAGAAA CAAAATATCT GGTTACAGGA 
ACGATCTTAT TATCATCTCC AATATCATCA GAGACTATTT TTTTTCTTCT TGAAGGGGCT 
AAAGCATTTG ATGTAAAAAT AGTTATTGAT TTGAATTGGA GACAGGTCTT TTGGGATCAT 
TCAAGTTTTT CATCAGAAAT TAGTCAAGCC ACTAGAGTTA ATTTAATCAA GAAATTTTTA 
AATCATGCAA ATGTTTTAAA ACTTGCTAAG GAGGAAGCAA CTTTGTTTTT TGAGGATGAA 
AATCCCTTCC TAATATCTCA ACAATTGTCT AATAGACCAG ATGTAATAAT AACTGATGGA 
AAAAATCCTG TTACATGGTA CATAAATGGT TTGCAGGGAA TTACCGAAAC TCCTTCTTCG 
CAAGAAATTG TTGATACAAC TGGAGCAGGA GATGCTTTTT TAGCTGGGTT AATTTCAAAA 
TTAATTTCTT CTGGTTATCC TTCAAATGAA CAAGAGATAG AAGATTGCAT TAAGTTTGCA 
GGTGCTTGTG GATTATTAAC TTGTCTTGGT GAAGGCGCCA TCGAGCAACA GCCATATTAC 
GAGAATGTTA ATAAATTTTT AGGATCTCTT ATTTCATAG

Protein sequence

MKNKKVICIG EALIDRIRNK SNQGFTDFLG GAPANVACAL RKLKIDSVFI GCLGSDDYGK 
KFITQFNKLD VNLDFLQLDN DSSTRVVNVD RDQFGERFFS GFEESSYSCF ADEVLSKKLI 
AKQILNLEKS FLETKYLVTG TILLSSPISS ETIFFLLEGA KAFDVKIVID LNWRQVFWDH 
SSFSSEISQA TRVNLIKKFL NHANVLKLAK EEATLFFEDE NPFLISQQLS NRPDVIITDG 
KNPVTWYING LQGITETPSS QEIVDTTGAG DAFLAGLISK LISSGYPSNE QEIEDCIKFA 
GACGLLTCLG EGAIEQQPYY ENVNKFLGSL IS