Gene NATL1_11521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_11521
Symbol
ID	4780978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1029659
End bp	1030630
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	43%
IMG OID	640084431
Product	ABC transporter, substrate binding protein, phosphate
Protein accession	YP_001014975
Protein GI	124025859
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID	[TIGR00975] phosphate ABC transporter, phosphate-binding protein

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.234302
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0131021
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTCG CCAAGAAGGC CCTCATCTTT ACTTCTTTGC TTGCAGTGGG CGCAGGCATG 
TCCGCAACTG CAGCTAGTCG TCTTAGTGGA GCAGGTGCAT CCTTCCCCGC TAAAATCTAC 
ACTCGTTGGT TTTCCGATTT AGCAAAAGAG GGTGGTCCTC GTGTTAACTA CCAAGCTGTT 
GGTTCAGGTT CTGGCCGTAA AGCATTCATT GATCAAACCG TAAACTTCGG TGCTTCTGAT 
GATCCAATGA AAGCAAAGGA TATTGCAAAA GTTACTCGTG GATTAGTTCA AATCCCAATG 
GTTGGAGGCA CAATTGCCTT TGGTTACAAC TACGATTGCG ACCTTAAACT TACTCAAGAG 
CAAGCTGTTC GCGTTGCTAT GGGTAAAATC TCAAATTGGA AAGAAGTTGG TTGTCCAGCA 
GGAAAAATGA CATGGGCACA TCGCTCTGAT GGCTCCGGTA CAACCAAGGC TTTTTCAAAC 
TCTATGCAAG CTTTCTCTAA GACATGGAAT TTAGGAACAG GTAAATCTAT TGCTTGGCCT 
GCTGGTGTTG GTGGAAAAGG TAACGCTGGT GTTGCAGGCG TAATTCGTAA TACTCCTGGT 
GCAATTGGTT ATGTAAACCA GTCATATATT AAAGGAGAAA TCAAGGCTGC CGCTCTTCAA 
AACTTATCTG GAGAGTATTT AAAGCCATCT ACTGAGTCAG GAGCTAAAGC TCTTAATGGA 
ATTAAGTTAG ATGAAAATTT AGCAGGTAAA AACCCCAACC CAAAAGCTAA GGGTGCATAC 
CCAATCGCTA CGTTGACATG GATTCTTGCT TATGAAGAAG GCAATGGTAG AAATACTAAA 
GCCATTCAAA AATCACTTAA CTACTTGCTA AGTGATAAAG CTCAGGCTAA GGCTCCTTCT 
CTTGGATTCG TACCTCTTAA AGGTGAAATT CTTAAAAAAT CACGTGCTGC CGTAAAGCGT 
ATTGGTAAAT AA

Protein sequence

MTFAKKALIF TSLLAVGAGM SATAASRLSG AGASFPAKIY TRWFSDLAKE GGPRVNYQAV 
GSGSGRKAFI DQTVNFGASD DPMKAKDIAK VTRGLVQIPM VGGTIAFGYN YDCDLKLTQE 
QAVRVAMGKI SNWKEVGCPA GKMTWAHRSD GSGTTKAFSN SMQAFSKTWN LGTGKSIAWP 
AGVGGKGNAG VAGVIRNTPG AIGYVNQSYI KGEIKAAALQ NLSGEYLKPS TESGAKALNG 
IKLDENLAGK NPNPKAKGAY PIATLTWILA YEEGNGRNTK AIQKSLNYLL SDKAQAKAPS 
LGFVPLKGEI LKKSRAAVKR IGK