Gene PCC8801_3850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3850
Symbol
ID	7102138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4029557
End bp	4030627
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	45%
IMG OID	643476855
Product	photosystem q(b) protein
Protein accession	YP_002373956
Protein GI	218248585
COG category
COG ID
TIGRFAM ID	[TIGR01151] photosystem II, DI subunit (also called Q(B))

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCATG TTATCCAACG TCGCCGAGAA TGGGATATAG GTAGCAGTTG GGACAAGTTT 
TGCCAATGGG TAACGAGTAC CGATAATCGG ATTTATATCG GTTGGTTTGG CCTGTTGATG 
ATTCCCACCT TAATCGCTGC TATCACTTGC TTTATTATCG CCTTTATTAC CGCTCCTGCT 
GTGGATATGG AAGGCATTCG GGAACCCATT TTAGGCTCAA TTTTGAGTGG TAATAACGTC 
ATTTCCGCCG CCGTCGTTCC CACTTCCGCC GCCATTGGCC TACACTTCTA TCCTATCTGG 
GATGCTGCCT CGATGGATGA ATGGCTCTAC AATGGAGGCC CCTATCAACT GATCATTTTC 
CATTTCTTAA TTGGAATTTG GTGTTATTTA GGTCGTTTGT GGGAATTGAG CTACCGTTTA 
GGTATGCGTC CTTGGATTTC CGTTGCTTTT TCTGCCCCTG TTGCAGCAGC GACTTCTATC 
TTTCTGATTT ATCCTATTGG ACAAGGAAGC TTTTCTGAAG GAATGCCCCT CGGTATTAGC 
GGCACATTCC ACTTTATGTT AGCCTTCCAA GCGGCTCATA ACATCCTGAT GCACCCCTTA 
CATATGTTAG CCGTTTCAGG AGTGTTTGCG GGAGCGTTAC TGGCTGCTTT ACACGGTTCT 
TTAGTGACTT CTAGCCTCAT TCGGGAAACC ACCATCGAAG AATCAGTTAA TGAAGGGTAT 
CACTTCGGTC AGGAGGAAAC CACCTATAAT TTAGTCGCTG GCCACGCGGG TTATTTAGGT 
CGTTTGTTAA TTCCCAGTTT GGGATGGCAA AATAGCCGTT CAATTCACTT TATTTTAGGA 
GCTATTCCTG TTATTGGAAT TTGGTGTGCT GCCTTGGCTA TTGGGGTGAT GGCTTTTAAC 
CTCAATGGGT TTAATTTTAA TCAATCTATT CATGATAGCC AAGGTCATCC TATCCTCACC 
GAAGCTGATA TGTTAAATCG CGCTAATTTA GGCATTCGTG CCATGCACGC TCCCAATACC 
CATCATTTTC CCCTTACCTT AGCTAGTGGA GAAAGTATCC CCCTTAGTTA A

Protein sequence

MTHVIQRRRE WDIGSSWDKF CQWVTSTDNR IYIGWFGLLM IPTLIAAITC FIIAFITAPA 
VDMEGIREPI LGSILSGNNV ISAAVVPTSA AIGLHFYPIW DAASMDEWLY NGGPYQLIIF 
HFLIGIWCYL GRLWELSYRL GMRPWISVAF SAPVAAATSI FLIYPIGQGS FSEGMPLGIS 
GTFHFMLAFQ AAHNILMHPL HMLAVSGVFA GALLAALHGS LVTSSLIRET TIEESVNEGY 
HFGQEETTYN LVAGHAGYLG RLLIPSLGWQ NSRSIHFILG AIPVIGIWCA ALAIGVMAFN 
LNGFNFNQSI HDSQGHPILT EADMLNRANL GIRAMHAPNT HHFPLTLASG ESIPLS