Gene NATL1_15551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_15551
Symbol
ID	4779094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1263263
End bp	1264375
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	44%
IMG OID	640084837
Product	hypothetical protein
Protein accession	YP_001015377
Protein GI	124026261
COG category
COG ID
TIGRFAM ID	[TIGR03041] chlorophyll a/b binding light-harvesting protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.203138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAGCT ATGGAAATCC AGACGTTACT TACGAGTGGT GGGCTGGTAA TTCTGTGGTC 
ACAAGTCGTT CTGGTCGATT CATAGCCTCC CATATTGGGC ATACAGGCTT GATCGCATTC 
GCGGCTGGAG GAAGTACCCT TTGGGAACTT GCTCGCTACA ATCCAGAGAT CCCTATGGGG 
CATCAAAGCT CCTTATTCTT GGGGCATCTT GCCGCTTTTG GCGTAGGTTT TGACGAGGCT 
GGAGCTTGGA CTGGTGTTGG TGTAGCAGCC GTAGCCATTG TCCACTTGGT TTTGTCAATG 
GTTTACGGAG GTGGTGCTTT ATTGCATGCA GTTTATTTTG AAGCTGATGT TGCAGATAGT 
GAGGTTCCAA GAGCTAGAAA GTTTAAATTG GAATGGAATA ATCCGGATAA TCAGACGTTT 
ATCCTGGGCC ATCATTTATT CTTCTTTGGA ATGGCTTGCA TAGCCTTTGT TGAATGGGCA 
AGAATTCACG GCATATATGA TCCAGCTATT GGTGCGGTAA GACAGGTCAA TTACAATCTT 
GATTTGACGA TGATATGGAA TCGTCAATTT GATTTCATCG GAATTGATAG TCTCGAAGAT 
GTAATGGGTG GTCATGCATT TCTTGCTTTT GCAGAATTGA CCGGCGCAAC TATTCATATG 
GTTGCAGGTT CAACTCAATG GGAAAACAAG AGACTTGGTG AATGGAGTAA GTACAAAGGA 
GCTGAATTGC TTTCTGCAGA GGCAGTCCTT TCATGGTCTC TTGCTGGTAT TGGTTGGATG 
GCAATTGTTG CTGCATTCTG GGCTGCTACC AATACAACCG TTTATCCAAT TGAGTGGTTT 
GGTGAGCCTT TGAAGTTACA GTTCTCAGTT GCTCCATATT GGATTGATAC AGCAGATAGC 
ACTGGCATAA CAGCTTTCTT TGGTCACACA ACTAGGGCTG CTTTAGTTAA TGTTCATTAT 
TACTTTGGAT TTTTCTTCTT ACAGGGTCAT TTCTGGCATG CTTTACGTGC GTTAGGATTT 
GACTTCAAGA AGGTTTCCGA AGCAATTGGT AATACTGAAG GGGCAACAGT CAGGGTTGAA 
GGCGCTGGTT TCAATGGAAG AGCTCCAAGA TAG

Protein sequence

MQSYGNPDVT YEWWAGNSVV TSRSGRFIAS HIGHTGLIAF AAGGSTLWEL ARYNPEIPMG 
HQSSLFLGHL AAFGVGFDEA GAWTGVGVAA VAIVHLVLSM VYGGGALLHA VYFEADVADS 
EVPRARKFKL EWNNPDNQTF ILGHHLFFFG MACIAFVEWA RIHGIYDPAI GAVRQVNYNL 
DLTMIWNRQF DFIGIDSLED VMGGHAFLAF AELTGATIHM VAGSTQWENK RLGEWSKYKG 
AELLSAEAVL SWSLAGIGWM AIVAAFWAAT NTTVYPIEWF GEPLKLQFSV APYWIDTADS 
TGITAFFGHT TRAALVNVHY YFGFFFLQGH FWHALRALGF DFKKVSEAIG NTEGATVRVE 
GAGFNGRAPR