Gene P9303_13331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_13331
Symbol	stpA
ID	4778777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1141619
End bp	1142824
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	49%
IMG OID	640086841
Product	putative glucosylglycerolphosphate phosphatase
Protein accession	YP_001017345
Protein GI	124023038
COG category
COG ID
TIGRFAM ID	[TIGR02399] glucosylglycerol 3-phosphatase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.788398
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCACA TCGACCTCGA TCAGCTTTTG GCTGAGATGG TCAGTACTGA AGACCTCTTG 
ATCGTTCAGG ATCTTGACGG CGTTTGTATC CCCCTTGTCA AGGATCCTCT GACGAGAGTT 
TTGGATCCTG CCTATGTATG GGCTGCCAAA AGGCTTGAGG GGTCTTTCTC TGTACTGACC 
AATGGAGAGC ATGGCGGACA TCGTGGAGTC AATTGTGTAG TCGAGAGGGC TTTGGGTGAT 
CCCCAGCTGC CGGCTAAGCA GGGCCTCTAC TTACCGGGAT TAGCCGCAGG CGGTGTGCAA 
CTGCAGAATT GTTATGGCGA GATCAGTCAT CCCGGCATTA GTGATAAAGA AATTGCCTTT 
CTTGCTGCAC TGCCTAGCCG AATGCAGACC TTGCTTGAAC AGCGTCTCCC TGCATTGCTA 
CCCCAGCTCA CCTCTGATGA GATCCAAACC CTCGCAAAGA TGTCAGTTCT TGATACAGAG 
CTATCGCCCA CAATTCTCTT AAATGGCTTG TTTAGCCTGA CTCCTGACGA TGTCGGCATT 
CAGCAATCCC TGCAAATTAT GTTGCAGGAG TTGATGAATG AATTGATTAA TAGTGCAATA 
AGTGCTGGCT TACCTAATTC GTTTTTTCTG CATATTGCCC CCAACATGGG CTGTGATGGA 
CAACGGGAGA GGCTCAAGCC TGCTGCCCCT GGCGATGTAG GCACCACTGA TATCCAGTTC 
ATGCTCAAAG GTGCTGTCAA GGAAGCCGGA CTATTGGTTT TGATTAACAA GCACATCGCT 
AAATACAAAG GCAAAGCTCC TCTCGGCAAA GACTTTGATG TGCGTTCAGC ACCTAAGACT 
CATCAGGGAT TGTTGGATCT CTGCCGCAAA CATATTCCTG TTGATCAGAT GCCACTTTTG 
ATGGGTGTGG GTGATACGGT TACATCCAAT CCATCTCCTG ATGGAACTGG ATGGTTACGT 
GGCGGAAGCG ACCGCGGTTT TCTTACCTTG TTACAGGATT TAGGTAGAAT TTATAACCGT 
ACCAATCGAG TGGTTCTTGT CGATAGTAGT GGCGGTGAAG TATACCGACC CAGCTTGGTG 
GATGAACGAT TACAAGGGAT CAGTGATCCT GAGGATCCCT TGCATTTTGA TGTACTGGTT 
CCTAGCGGCC CCAGCACATA CGTGGCTTGG TTTAGGTCAC TCGCTGAACG ACGTTCAGCT 
CGTTGA

Protein sequence

MGHIDLDQLL AEMVSTEDLL IVQDLDGVCI PLVKDPLTRV LDPAYVWAAK RLEGSFSVLT 
NGEHGGHRGV NCVVERALGD PQLPAKQGLY LPGLAAGGVQ LQNCYGEISH PGISDKEIAF 
LAALPSRMQT LLEQRLPALL PQLTSDEIQT LAKMSVLDTE LSPTILLNGL FSLTPDDVGI 
QQSLQIMLQE LMNELINSAI SAGLPNSFFL HIAPNMGCDG QRERLKPAAP GDVGTTDIQF 
MLKGAVKEAG LLVLINKHIA KYKGKAPLGK DFDVRSAPKT HQGLLDLCRK HIPVDQMPLL 
MGVGDTVTSN PSPDGTGWLR GGSDRGFLTL LQDLGRIYNR TNRVVLVDSS GGEVYRPSLV 
DERLQGISDP EDPLHFDVLV PSGPSTYVAW FRSLAERRSA R