Gene NATL1_07021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_07021
Symbol	stpA
ID	4780402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	644483
End bp	645682
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	32%
IMG OID	640083978
Product	putative glucosylglycerolphosphate phosphatase
Protein accession	YP_001014527
Protein GI	124025411
COG category
COG ID
TIGRFAM ID	[TIGR02399] glucosylglycerol 3-phosphatase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0547585
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAT TTAAGATGAA AGAAGAAATT ATTAACACTA TAATAAACGA ACAAAATATT 
CTAATAGTTC AGGATCTTGA CGGCGTTTGT ATTCCACTAG TTCAAGACCC ACTTCAAAGA 
GAGATCAACA AAGACTATGT GAAGGACGTT TCAAGATTAA GAGAGAAGTT TGCAGTTCTA 
ACCTGCGGAG AGCATGAAGG CAAAAGAGGC GTTAATCGCT TAGTAGAAAA GGCACTTGAT 
TCGAAAAAAA CTGCAAAAGA AAATGGCTTT TACTTACCTG GCCTTGCAGC GTGTGGAGTT 
GAGTATCAAG ATAGATTTAG TAATTTATCC TATCCAGGGC TCAAAGATAA TGAGATTAAC 
TTTTTAGCAG AAGTTCCAAA GATGATGAGA TCAATGTTAA CTAATGAATT AAAAAAATTC 
TTACCAAACC TTTCGAATGA GAAAAGAAAT AAATTAATTG ATGTGGCTGT ATGTGATACG 
CGCTTTACAC CTACTTTAAA TTTCAATGAA ATCTTTAGCT ACGTTAAAAA TGATTTTCAA 
CAAGTTAAAG ATTTGCAATT GATTATGGGA AAAATAATGA ATGATTTGCT CGAAGAATCT 
AAAAATTTTG GCTTAGATAA TTCTTTTTAT CTGCATTTGA TGCCTAATCT AGGAATAAGA 
GATGGCAGAG AAATAATGAA ATATTCTACT CAAAATGAAT TTGGAACAAC AGATATACAG 
TTCATTATCA AAGGTGCAAT AAAAGAAGCA GGCCTTTTAT TTCTATTAAA TAAATACATA 
GCAAATAAAA CTGGCGTTTA TCCATTCGGT GAAAACTTCA ATGTCAGGAA TGCTCCTAAG 
ACGCATGCTC AATTAATAAA GCTATGCAGA GATAAAATAC CGCACGAACA AATGCCACTT 
CTAGTAGGTG TTGGCGATAC GGTAACCTCG GTTAAAGATA ATAAAGATAA TTCTTGGTTA 
AGAGGTGGAA GTGATCGAGG TTTTTTAACA TTGATCCAAA GGTTGGGAGA ATCATATAAG 
AAAGATAATC AAGTTGTATT TGTTAACAGC TGCAACGAGC AGGTATTAAG ACCAAGAATA 
AATGGAACTG ATATGCAAGG AATTAGTGAT CCTAATGATG ATTTAAAATT CAATATGATT 
ATTAATGATG GACCAAAAGA ATATATTGAG TGGTTTAAAC AATTAGCTAG TAACTTTTAG

Protein sequence

MKIFKMKEEI INTIINEQNI LIVQDLDGVC IPLVQDPLQR EINKDYVKDV SRLREKFAVL 
TCGEHEGKRG VNRLVEKALD SKKTAKENGF YLPGLAACGV EYQDRFSNLS YPGLKDNEIN 
FLAEVPKMMR SMLTNELKKF LPNLSNEKRN KLIDVAVCDT RFTPTLNFNE IFSYVKNDFQ 
QVKDLQLIMG KIMNDLLEES KNFGLDNSFY LHLMPNLGIR DGREIMKYST QNEFGTTDIQ 
FIIKGAIKEA GLLFLLNKYI ANKTGVYPFG ENFNVRNAPK THAQLIKLCR DKIPHEQMPL 
LVGVGDTVTS VKDNKDNSWL RGGSDRGFLT LIQRLGESYK KDNQVVFVNS CNEQVLRPRI 
NGTDMQGISD PNDDLKFNMI INDGPKEYIE WFKQLASNF