Gene Cyan8802_1987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_1987
Symbol
ID	8391303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	2006599
End bp	2007657
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	51%
IMG OID	644979968
Product	photosystem II D2 protein (photosystem q(a) protein)
Protein accession	YP_003137713
Protein GI	257059825
COG category
COG ID
TIGRFAM ID	[TIGR01151] photosystem II, DI subunit (also called Q(B)) [TIGR01152] Photosystem II, DII subunit (also called Q(A))

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000347488
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0187293
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATTG CAGTCGGACG CGCCCCAGCA CAAAGAGGAT GGTTTGATGT CCTCGATGAC 
TGGCTCAAAC GCGATCGCTT TGTATTCGTT GGTTGGTCAG GTTTATTACT CTTCCCCTGT 
GCCTACTTGG CTTTAGGGGG ATGGTTAACC GGAACCACCT TTGTTACCTC CTGGTATACC 
CACGGTTTGG CTAGTTCCTA CCTCGAAGGC TGTAACTTCC TCACCGTTGC CGTCTCTTCC 
CCCGCTAACG CCTTCGGTCA CTCCCTTCTC TTCCTGTGGG GACCCGAAGC GCAAGGCGAC 
TTCACCCGTT GGTGTCAAAT TGGCGGACTT TGGACTTTTA CCGCCCTTCA CGGTGCTTTT 
GGACTGATCG GCTTCATGCT GCGTCAGTTT GAAATTGCTC GTCTGGTTGG TATTCGTCCC 
TACAACGCCA TCGCCTTCTC TGCTCCCATC GCCGTGTTCG TCAGTGTTTT CCTGATGTAC 
CCCTTGGGAC AGTCTGGCTG GTTCTTCGGA CCTAGCTTCG GAGTGGCGGG AATTTTCCGC 
TTTATCCTGT TCTTACAAGG GTTCCACAAC TGGACACTTA ACCCCTTCCA CATGATGGGA 
GTAGCGGGTG TTCTCGGTGG TGCGTTACTC TGTGCTATCC ACGGGGCAAC CGTAGAAAAC 
ACCCTGTTTG AAGATAGCGA TCAAGCTAAC ACCTTCCGCG CTTTTGAACC TACCCAAGCT 
GAAGAAACCT ACTCCATGGT AACGGCGAAC CGTTTCTGGT CACAGATCTT CGGGATTGCT 
TTTTCCAACA AACGTTGGTT ACACTTCTTT ATGCTGTTCG TCCCTGTGAC TGGACTGTGG 
ATGAGTGCGA TCGGTATTGT GGGTTTAGCC CTCAACCTCC GCGCTTACGA CTTCGTATCG 
CAAGAATTAC GCGCTGCTGA AGACCCTGAA TTTGAAACCT TCTACACCAA GAATATCTTG 
TTGAACGAAG GTTTACGCGC TTGGATGGCT CCCCAAGACC AACCCCACCA GAATTTTGTA 
TTCCCTGAAG AAGTTCTACC TCGCGGTAAC GCTCTCTAA

Protein sequence

MTIAVGRAPA QRGWFDVLDD WLKRDRFVFV GWSGLLLFPC AYLALGGWLT GTTFVTSWYT 
HGLASSYLEG CNFLTVAVSS PANAFGHSLL FLWGPEAQGD FTRWCQIGGL WTFTALHGAF 
GLIGFMLRQF EIARLVGIRP YNAIAFSAPI AVFVSVFLMY PLGQSGWFFG PSFGVAGIFR 
FILFLQGFHN WTLNPFHMMG VAGVLGGALL CAIHGATVEN TLFEDSDQAN TFRAFEPTQA 
EETYSMVTAN RFWSQIFGIA FSNKRWLHFF MLFVPVTGLW MSAIGIVGLA LNLRAYDFVS 
QELRAAEDPE FETFYTKNIL LNEGLRAWMA PQDQPHQNFV FPEEVLPRGN AL