Gene PCC8801_2016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2016
Symbol
ID	7104784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2090110
End bp	2091180
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	48%
IMG OID	643475077
Product	photosystem q(b) protein
Protein accession	YP_002372209
Protein GI	218246838
COG category
COG ID
TIGRFAM ID	[TIGR01151] photosystem II, DI subunit (also called Q(B))

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTACCA CCTTACAACA ACGCGAGAGC GTTTCCGTTT GGGAGCAGTT CTGTCAGTGG 
GTAACAAGCA CCAACAACCG TCTTTATGTC GGCTGGTTCG GTACTTTAAT GATCCCCACC 
CTCTTAACTG CAACCACTTG CTTCATCATC GCTTTCATCG CTGCACCTCC CGTGGACATC 
GATGGTATCC GTGAACCCGT TGCTGGTTCT TTACTTTATG GAAACAACAT CATCTCTGGT 
GCAGTTGTTC CTTCTAGCAA CGCTATCGGA TTACACTTCT ACCCCATCTG GGAAGCTGCT 
TCTCTTGATG AGTGGCTCTA CAACGGCGGA CCTTACCAAT TAGTAGTCTT CCACTTCTTA 
ATCGGAGTAT TTTGCTACTT AGGCCGTCAG TGGGAACTAT CTTACCGCTT AGGAATGCGT 
CCTTGGATTT GCGTAGCCTA CAGCGCACCT GTTTCCGCAG CTACTGCCGT GTTCTTAATC 
TACCCCATCG GACAAGGTTC TTTCTCTGAT GGAATGCCTT TAGGAATTAG CGGAACCTTC 
AACTTCATGT TCGTGTTCCA AGCTGAGCAC AACATCCTAA TGCACCCCTT CCATATGTTG 
GGAGTTGCTG GTGTCTTTGG TGGTTCTTTG TTCTCCGCTA TGCACGGTTC TTTAGTCACC 
TCTTCCTTAG TCCGTGAAAC CACTGAAATC GAGTCTCAAA ACTACGGTTA CAAGTTCGGA 
CAAGAAGAAG AAACCTACAA CATCGTAGCT GCTCACGGAT ACTTTGGACG TTTAATCTTC 
CAATACGCAT CCTTCAACAA CAGCCGTGCC TTACACTTCT TCTTAGGTGC ATGGCCTGTA 
ATCGGTATCT GGTTCACCGC AATGGGTGTA TCTACCATGG CTTTCAACCT CAACGGTTTC 
AACTTCAACC AATCGATTCT TGACTCACAA GGTCGCGTAA TCGGAACCTG GGCTGATGTA 
CTCAACCGTG CAGGAATTGG AATGGAAGTA ATGCACGAGC GCAACGCTCA CAACTTCCCC 
TTAGACTTAG CTTCTGCTGA GCCTGTGTCT GCTCCTGCTA TCAATGGTTA A

Protein sequence

MTTTLQQRES VSVWEQFCQW VTSTNNRLYV GWFGTLMIPT LLTATTCFII AFIAAPPVDI 
DGIREPVAGS LLYGNNIISG AVVPSSNAIG LHFYPIWEAA SLDEWLYNGG PYQLVVFHFL 
IGVFCYLGRQ WELSYRLGMR PWICVAYSAP VSAATAVFLI YPIGQGSFSD GMPLGISGTF 
NFMFVFQAEH NILMHPFHML GVAGVFGGSL FSAMHGSLVT SSLVRETTEI ESQNYGYKFG 
QEEETYNIVA AHGYFGRLIF QYASFNNSRA LHFFLGAWPV IGIWFTAMGV STMAFNLNGF 
NFNQSILDSQ GRVIGTWADV LNRAGIGMEV MHERNAHNFP LDLASAEPVS APAING