Gene Cyan8802_0053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_0053
Symbol
ID	8389356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	55855
End bp	57237
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	49%
IMG OID	644978101
Product	photosystem II 44 kDa subunit reaction center protein
Protein accession	YP_003135860
Protein GI	257057972
COG category
COG ID
TIGRFAM ID	[TIGR01153] photosystem II 44 kDa subunit reaction center protein (also called P6 protein, CP43), bacterial and chloroplast [TIGR03041] chlorophyll a/b binding light-harvesting protein

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000498494
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTAACGC TCTCTAATGT TTCCGTTACC AGTGGACGTG ACCTAGAATC AACTGGTTTT 
GCATGGTGGT CAGGCAATGC TCGTCTGATC AACCTCTCCG GTAAGCTTCT CGGTGCTCAC 
GTCGCTCACG CTGGTTTGAT TGTTTTCTGG GCCGGGGCAA TGACCCTGTT TGAAACCGCC 
CACTTTATTC CCGAAAAGCC CATGTACGAA CAGGGCTTAA TTCTCCTGCC CCACATTGCT 
ACCCTCGGTT GGGGTGTAGG ACCTGGTGGT GAAGTAATTG ATACCTTCCC CTTCTTTGTT 
GCAGGGGTAT TACACCTGAT TTCTTCTGCT GTTCTCGGTT TTGGTGGTAT TTATCACGCT 
CTGCGTGGTC CTGAAACCTT AGAAGAGTAT TCCAGCTTCT TCGGTTACGA CTGGAAGGAC 
AAAAACCAGA TGACCAACAT CATCGGTTAT CACCTAATTC TTTTGGGTTG TGGTGCGCTG 
TTGTTGGTAT TCAAAGCCAT GTTCTTTGGT GGCGTTTATG ACACCTGGGC TCCTGGTGGT 
GGTGATGTCC GGGTAATCAC CAATCCTACC TTAAATCCTG CCGTGATCTT TGGTTATCTG 
ACCAAGGCTC CCTTTGGTGG CGAAGGTTGG ATTATTAGTG TCAACAACAT GGAAGATATT 
ATTGGCGGTC ACATTTGGAT CGGCCTAATT TGTATCTTCG GTGGTATTTG GCACATTTTA 
ACCAAGCCCT TTGGTTGGGC TCGTCGCGCC TTTATCTGGT CTGGTGAAGC TTACCTATCT 
TACAGTTTAG GAGCTTTATC CATGATGGGT TTCATCGCGG CGGTTTTTGT TTGGTTTAAC 
AACACCGCTT ACCCCAGTGA GTTCTATGGA CCCACCGGGA TGGAAGCATC TCAATCTCAA 
GCTTTCACCT TCTTGGTTCG TGACCAACGC TTAGGGGCTA ATATTGGTTC TGCTCAAGGT 
CCGACTGGGT TAGGTAAATA TTTAATGCGT TCTCCTACCG GTGAAATCAT CTTCGGTGGT 
GAAACCATGC GTTTCTGGGA CTTCCGTGGT CCTTGGTTAG AACCCCTGCG CGGTCCTAAC 
GGTCTAGACT TAGACAAGTT AAAAAATGAC GTTCAGCCTT GGCAAATTCG TCGCGCTGCT 
GAATATATGA CCCACGCGCC TTTAGGTTCT TTGAACTCTG TGGGTGGGGT TATCACCGAT 
GTTAACTCCT TTAACTACGT TTCTCCCCGT GCGTGGTTGG CGACTTCTCA CTTTACTTTA 
GCTTTCTTCT TCCTGATTGG TCATCTGTGG CACGCTGGAC GTGCACGGGC GGCTGCGGCT 
GGATTTGAGA AAGGGATTGA TCGTGAGACT GAACCCGTAC TGTCTATGCC TGACCTTGAC 
TAA

Protein sequence

MVTLSNVSVT SGRDLESTGF AWWSGNARLI NLSGKLLGAH VAHAGLIVFW AGAMTLFETA 
HFIPEKPMYE QGLILLPHIA TLGWGVGPGG EVIDTFPFFV AGVLHLISSA VLGFGGIYHA 
LRGPETLEEY SSFFGYDWKD KNQMTNIIGY HLILLGCGAL LLVFKAMFFG GVYDTWAPGG 
GDVRVITNPT LNPAVIFGYL TKAPFGGEGW IISVNNMEDI IGGHIWIGLI CIFGGIWHIL 
TKPFGWARRA FIWSGEAYLS YSLGALSMMG FIAAVFVWFN NTAYPSEFYG PTGMEASQSQ 
AFTFLVRDQR LGANIGSAQG PTGLGKYLMR SPTGEIIFGG ETMRFWDFRG PWLEPLRGPN 
GLDLDKLKND VQPWQIRRAA EYMTHAPLGS LNSVGGVITD VNSFNYVSPR AWLATSHFTL 
AFFFLIGHLW HAGRARAAAA GFEKGIDRET EPVLSMPDLD