Gene A9601_13631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_13631
Symbol
ID	4718083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1133998
End bp	1135056
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	37%
IMG OID	640079083
Product	chlorophyll a/b binding light harvesting protein PcbD
Protein accession	YP_001009754
Protein GI	123968896
COG category
COG ID
TIGRFAM ID	[TIGR03041] chlorophyll a/b binding light-harvesting protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTACAAA CTTACGGAAA ATCTGATGTC ACCTATGACT GGTACGCAGG GAATTCTGGT 
GTTGTTGGCC GTTCAGGTAA ATTCATAGCT GCTCATGCTG CCCATGCAGG CCTAATGATG 
TTTTGGGCAG GAGCTTTTGG ATTATTTGAA TTGGCTCGTT ACGACGCCAG TATTCCAATG 
GGCGCACAGA AAGCAATTGT TTTGCCTCAC CTAGCGGGTA TTGGAATTGG TGGCATTGAA 
AATGGTGTTA TTACTGAACC ATATGGAATA GTTGTAATTT GCACATTACA TCTAATTTTC 
TCAGCAGTAT TGGGTGCTGG TGGATTATTA CACTCCAATA AATTTGCAGG TGATCTTGGA 
GACTATCCAG AAAATAGTAA GCCACAAAAA TTTGATTTTG AATGGGATGA TCCAGATAAA 
TTAACTTTTA TTCTTGGTCA TCATCTAATC TTTCTTGGAC TTGGAGCAAT TATGTTCGTT 
GAATGGGCTC GAATTCATGG AATTTACGAC CCAGCAATAG GATCCACGAG ACAAGTTATT 
TACAACTTAG ATATTGCCGC TATCTGGAAT CATCAATTTG ATTTTTTAAA AATAGATAGT 
TTGGAAGATG TTATGGGAGG ACATGCTTTC CTAGCTTTCC TCGAAATAAT TGGAGGAGTT 
TTCCATATTT GTACTAAACA ATTTGGAGAA TATACAGAAT TTAAAGGAAA AGGATTACTT 
GGCGCTGAGG CAATCTTGTC ATACTCAGTT GTTGGTGTTT CTTATATGGC TTTTGTTGCT 
GCTTTTTGGT GTGCTTCTAA TACAACTATA TATCCAGTTG ATCTATATGG AGAACCCTTG 
AAGCTTCAAT TTGAATTCGC CCCTTATTTT ACTGATACAG TAGATTTAGG TTCAGGAGCG 
TACAGCTCAA GAGCTTGGCT TGCTAATACT CATTTTTATT TGGGTTTCTT TTTCTTACAA 
GGTCATCTTT GGCACGCACT AAGAGCAATG GGATTTGACT TTAAGAAAAT TGGTCAAGCT 
TTTGATAATA TTGAAAATAC AAAAATTACT CAAAACTAG

Protein sequence

MLQTYGKSDV TYDWYAGNSG VVGRSGKFIA AHAAHAGLMM FWAGAFGLFE LARYDASIPM 
GAQKAIVLPH LAGIGIGGIE NGVITEPYGI VVICTLHLIF SAVLGAGGLL HSNKFAGDLG 
DYPENSKPQK FDFEWDDPDK LTFILGHHLI FLGLGAIMFV EWARIHGIYD PAIGSTRQVI 
YNLDIAAIWN HQFDFLKIDS LEDVMGGHAF LAFLEIIGGV FHICTKQFGE YTEFKGKGLL 
GAEAILSYSV VGVSYMAFVA AFWCASNTTI YPVDLYGEPL KLQFEFAPYF TDTVDLGSGA 
YSSRAWLANT HFYLGFFFLQ GHLWHALRAM GFDFKKIGQA FDNIENTKIT QN