Gene A9601_12521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_12521
Symbol
ID	4717969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1058789
End bp	1059871
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	44%
IMG OID	640078971
Product	hypothetical protein
Protein accession	YP_001009643
Protein GI	123968785
COG category
COG ID
TIGRFAM ID	[TIGR01151] photosystem II, DI subunit (also called Q(B))

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACTA TTCAGCAGCA GCGTTCTTCG CTGTTAAAAG GTTGGCCACA GTTTTGTGAG 
TGGGTAACAT CAACTAACAA CAGAATTTAT GTTGGTTGGT TCGGCGTCTT AATGATTCCA 
TGCCTTCTTA CAGCAGCGGC TTGCTTCATC GTTGCATTCA TCGCAGCACC ACCAGTAGAC 
ATCGACGGAA TTAGAGAGCC AGTTGCTGGT TCATTCCTAT ATGGAAACAA CATCATCTCA 
GGTGCAGTTG TTCCTTCATC TAACGCTATT GGTCTACACT TCTACCCAAT TTGGGAAGCA 
GCTACTGTAG ATGAGTGGTT ATACAACGGT GGTCCTTACC AGCTTGTAAT TTTCCACTTC 
CTAATTGGTA TCTCAGCATA CATGGGAAGA CAGTGGGAGC TTTCATACCG TTTAGGTATG 
CGTCCTTGGA TCTGTGTTGC ATACTCTGCA CCAGTTTCAG CAGCTTTCGC AGTATTTCTT 
GTATACCCAT TCGGTCAAGG TTCATTCTCT GACGGAATGC CTTTAGGTAT CTCTGGAACA 
TTCAACTTCA TGTTTGTTTT CCAGGCAGAG CACAACATTC TTATGCACCC ATTCCACATG 
GCTGGTGTTG CTGGTATGTT CGGAGGATCT TTATTCTCAG CTATGCACGG TTCACTTGTT 
ACTTCATCTC TAATCAGAGA AACAACTGAG ACAGAGTCTC AGAACTATGG TTACAAGTTC 
GGACAAGAAG AAGAAACATA TAACATCGTT GCAGCTCATG GCTACTTCGG TCGTTTGATC 
TTCCAATATG CTTCATTCAA CAACAGCAGA AGTCTTCACT TCTTCCTAGC TGTATTCCCA 
GTTGTTTGTG TATGGTTAAC TTCAATGGGT ATCTGCACAA TGGCATTCAA CCTTAACGGT 
TTCAACTTCA ACCAGTCAGT TGTTGATGCA AACGGTAAGA TTGTTCCTAC ATGGGGTGAC 
GTTCTTAACA GAGCAAACCT AGGTATGGAA GTAATGCACG AGCGTAACGC TCACAACTTC 
CCACTTGATC TAGCAGCAGC TGAGTCTACA ACAGTAGCTC TTTCAGCTCC AGCTATCGGT 
TAA

Protein sequence

MTTIQQQRSS LLKGWPQFCE WVTSTNNRIY VGWFGVLMIP CLLTAAACFI VAFIAAPPVD 
IDGIREPVAG SFLYGNNIIS GAVVPSSNAI GLHFYPIWEA ATVDEWLYNG GPYQLVIFHF 
LIGISAYMGR QWELSYRLGM RPWICVAYSA PVSAAFAVFL VYPFGQGSFS DGMPLGISGT 
FNFMFVFQAE HNILMHPFHM AGVAGMFGGS LFSAMHGSLV TSSLIRETTE TESQNYGYKF 
GQEEETYNIV AAHGYFGRLI FQYASFNNSR SLHFFLAVFP VVCVWLTSMG ICTMAFNLNG 
FNFNQSVVDA NGKIVPTWGD VLNRANLGME VMHERNAHNF PLDLAAAEST TVALSAPAIG