Gene PCC8801_0056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0056
Symbol
ID	7103721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	58944
End bp	60002
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	52%
IMG OID	643473172
Product	photosystem II D2 protein (photosystem q(a) protein)
Protein accession	YP_002370319
Protein GI	218244948
COG category
COG ID
TIGRFAM ID	[TIGR01151] photosystem II, DI subunit (also called Q(B)) [TIGR01152] Photosystem II, DII subunit (also called Q(A))

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATTG CAGTTGGACG TGCCCCGGCA CAAAGAGGAT GGTTTGATGT CCTCGATGAC 
TGGTTAAAAC GCGATCGCTT TGTATTCGTT GGTTGGTCAG GTTTATTACT CTTCCCCTGT 
GCCTACTTGG CTTTAGGGGG ATGGTTAACC GGAACCACCT TTGTTACCTC CTGGTACACC 
CACGGTTTGG CTAGTTCCTA CCTCGAAGGC TGTAACTTCC TCACCGTTGC CGTCTCTTCC 
CCCGCTAACG CCTTCGGTCA CTCCCTTCTC TTCCTGTGGG GACCCGAAGC GCAAGGCGAC 
TTCACCCGTT GGTGTCAAAT TGGCGGACTT TGGACTTTTA CCGCCCTTCA CGGTGCTTTT 
GGACTGATCG GCTTCATGCT GCGTCAGTTT GAAATTGCTC GCCTTGTTGG TATCCGTCCC 
TACAACGCCA TCGCCTTCTC TGCTCCCATC GCCGTGTTCG TCAGTGTTTT CCTGATGTAC 
CCCTTGGGAC AGTCTGGCTG GTTCTTCGGA CCTAGCTTTG GAGTGGCGGG AATTTTCCGC 
TTTATCCTGT TCTTACAAGG GTTCCACAAC TGGACACTTA ACCCCTTCCA CATGATGGGA 
GTAGCGGGTG TTCTCGGTGG TGCGTTACTC TGTGCTATCC ACGGGGCAAC CGTAGAAAAC 
ACCCTGTTTG AAGATAGCGA TCAAGCTAAC ACCTTCCGCG CTTTTGAACC TACCCAAGCT 
GAAGAAACCT ACTCCATGGT AACGGCGAAC CGTTTCTGGT CACAGATCTT CGGGATTGCT 
TTTTCCAACA AACGTTGGTT ACACTTCTTT ATGCTGTTCG TCCCTGTGAC TGGACTGTGG 
ATGAGTGCGA TCGGTATTGT GGGTTTAGCC CTCAACCTCC GCGCTTACGA CTTCGTATCG 
CAAGAATTAC GCGCTGCTGA AGACCCTGAA TTTGAAACCT TCTACACCAA GAATATCTTG 
TTAAACGAAG GTTTACGCGC TTGGATGGCT CCCCAAGACC AACCCCACCA GAATTTTGTA 
TTCCCTGAGG AGGTACTCCC CCGTGGTAAC GCTCTCTAA

Protein sequence

MTIAVGRAPA QRGWFDVLDD WLKRDRFVFV GWSGLLLFPC AYLALGGWLT GTTFVTSWYT 
HGLASSYLEG CNFLTVAVSS PANAFGHSLL FLWGPEAQGD FTRWCQIGGL WTFTALHGAF 
GLIGFMLRQF EIARLVGIRP YNAIAFSAPI AVFVSVFLMY PLGQSGWFFG PSFGVAGIFR 
FILFLQGFHN WTLNPFHMMG VAGVLGGALL CAIHGATVEN TLFEDSDQAN TFRAFEPTQA 
EETYSMVTAN RFWSQIFGIA FSNKRWLHFF MLFVPVTGLW MSAIGIVGLA LNLRAYDFVS 
QELRAAEDPE FETFYTKNIL LNEGLRAWMA PQDQPHQNFV FPEEVLPRGN AL