Gene NATL1_15601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_15601
Symbol
ID	4780677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1266447
End bp	1267535
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	42%
IMG OID	640084842
Product	hypothetical protein
Protein accession	YP_001015382
Protein GI	124026266
COG category
COG ID
TIGRFAM ID	[TIGR03041] chlorophyll a/b binding light-harvesting protein

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.963648
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTCCT ACGGAAACCC AGACGTCACC TACGGGTGGT GGGTTGGTAA TTCTGTCGTA 
ACAAATAAGT CAAGCCGATT TATTGGCTCG CATGTTGCTC ATACAGGATT GATTTGTTTC 
GCAGCTGGTG CCAACACACT TTGGGAGCTC GCTAGATACA ACCCAGATAT TCCAATGGGA 
CACCAAGGAA TGGTGAGCAT CCCACACCTT GCTTCTATTG GTATTGGATT TGATCCAACT 
GGAACAGTAT TCGACGGAAC ATCAATTGCT TTTATCGGAG TATTCCATCT GATTTGTTCA 
ATGGTTTATG CGGGTGCAGG TCTATTGCAC TCTCTGATTT TTAGCGAAGA TACCCAAAAT 
AGTTCAGGTT TGTTTGCTGA TGATCGTCCT GAACATCGTC AGGCAGCAAG ATACAAGCTT 
GAATGGGATA ATCCAGATAA TCAGACTTTT ATTCTTGGTC ACCATTTGAT TTTCTTTGGT 
GTTGCATGTA TTTGGTTTGT TGAGTGGGCT CGAATACATG GGATTTACGA TCCTGCAATA 
GGAGCTGTTC GACAAGTCGA GTACAACTTA AACTTGACCA ACATTTGGAA TCATCAGTTT 
GATTTCTTGG CTATTGATAG TCTGGAGGAT GTTATGGGTG GTCATGCATT CTTAGCATTT 
GTTGAGATCA CAGGTGGTGC TTTCCATATC GCTACGAAGC AGACTGGAGA ATACACAGAA 
TTCAAAGGGA AGAATATTCT TTCTGCTGAA GCAGTTCTTT CCTGGTCTCT TGCTGGTATT 
GGTTGGATGG CAATTATTGC TGCTTTCTGG TGTGCAACCA ATACAACTGT TTATCCAGAG 
GCTTGGTACG GAGAAACATT AGCTCTTAAG TTTGGAATCT CTCCATATTG GATTGATACT 
GCTGATATGA CTGGTGTCGT TAGTGGTCAT ACTTCAAGAG CTTGGCTTGC GAATGTTCAT 
TACTATCTTG GTTTCTTCTT TATTCAAGGA CACCTTTGGC ATGCAATACG TGCTCTAGGC 
TTTGATTTCA AAAAGGTTAC TGATGCAATT AGTAATCTTG ATGGAGCAAG AGTTACTCTC 
ACTGATTGA

Protein sequence

MQSYGNPDVT YGWWVGNSVV TNKSSRFIGS HVAHTGLICF AAGANTLWEL ARYNPDIPMG 
HQGMVSIPHL ASIGIGFDPT GTVFDGTSIA FIGVFHLICS MVYAGAGLLH SLIFSEDTQN 
SSGLFADDRP EHRQAARYKL EWDNPDNQTF ILGHHLIFFG VACIWFVEWA RIHGIYDPAI 
GAVRQVEYNL NLTNIWNHQF DFLAIDSLED VMGGHAFLAF VEITGGAFHI ATKQTGEYTE 
FKGKNILSAE AVLSWSLAGI GWMAIIAAFW CATNTTVYPE AWYGETLALK FGISPYWIDT 
ADMTGVVSGH TSRAWLANVH YYLGFFFIQG HLWHAIRALG FDFKKVTDAI SNLDGARVTL 
TD