Gene Cyan8802_3899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3899
Symbol
ID	8393249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	4009553
End bp	4010623
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	45%
IMG OID	644981824
Product	photosystem q(b) protein
Protein accession	YP_003139538
Protein GI	257061650
COG category
COG ID
TIGRFAM ID	[TIGR01151] photosystem II, DI subunit (also called Q(B))

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0661393
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.162734
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCATG TTATCCAACG TCGCCGAGAA TGGGATATAG GTAGCAGTTG GGACAAGTTT 
TGCCAATGGG TAACAAGTAC CGATAATCGC ATTTATATCG GTTGGTTTGG CCTGTTGATG 
ATTCCCACCT TAATCGCTGC TATCACTTGC TTTATTATCG CCTTTATTAC CGCTCCTGCT 
GTGGATATGG AAGGCATTCG GGAACCCATT TTAGGCTCAA TTTTGAGTGG TAATAACGTC 
ATTTCCGCCG CCGTCGTTCC CACTTCCGCC GCCATTGGCC TACACTTCTA TCCTATCTGG 
GATGCTGCGT CGATGGATGA ATGGCTCTAC AATGGAGGCC CCTATCAACT GATCATTTTC 
CATTTCTTAA TTGGAATTTG GTGTTATTTA GGTCGTTTGT GGGAATTGAG CTACCGTTTA 
GGTATGCGTC CTTGGATTTC CATCGCTTTT TCTGCCCCTG TTGCAGCAGC GACTTCTATC 
TTTCTGATTT ATCCTATTGG ACAAGGGAGC TTTTCTGAAG GAATGCCCCT CGGTATTAGC 
GGCACATTCC ACTTTATGTT AGCCTTCCAA GCTGCCCATA ATATCCTCAT GCACCCCTTA 
CATATGTTAG CGGTGTCAGG CATCTTTGCG GGGGCTTTAT TAGCTTCTTT GCACGGTTCC 
TTAGTCACTT CTAGCCTTAT TCGGGAAACC ACCATCGAAG AATCGATTAA TCAAGGGTAT 
CACTTCGGTC AGGAGGAAAC CACCTATAAT TTAGTCGCTG GCCACGCGGG TTATTTAGGT 
CGTTTGTTAA TTCCCAGTTT GGGATGGCAA AATAGCCGTT CAATTCACTT TATTTTAGGA 
GCTATTCCTG TTATTGGAAT TTGGTGTGCT GCCTTGGCTA TTGGGGTTAT GGCTTTTAAC 
CTCAATGGGT TTAATTTTAA TCAATCTATT CATGATAGCC AAGGTCATCC TATCCTCACC 
GAAGCTGATA TGTTAAATCG CGCTAATTTA GGCATTCGTG CCATGCACGC TCCCAATACC 
CATCATTTTC CTCTTACCTT AGCCAGTGGT GAAAGTGTTC CCCTTAGTTA A

Protein sequence

MTHVIQRRRE WDIGSSWDKF CQWVTSTDNR IYIGWFGLLM IPTLIAAITC FIIAFITAPA 
VDMEGIREPI LGSILSGNNV ISAAVVPTSA AIGLHFYPIW DAASMDEWLY NGGPYQLIIF 
HFLIGIWCYL GRLWELSYRL GMRPWISIAF SAPVAAATSI FLIYPIGQGS FSEGMPLGIS 
GTFHFMLAFQ AAHNILMHPL HMLAVSGIFA GALLASLHGS LVTSSLIRET TIEESINQGY 
HFGQEETTYN LVAGHAGYLG RLLIPSLGWQ NSRSIHFILG AIPVIGIWCA ALAIGVMAFN 
LNGFNFNQSI HDSQGHPILT EADMLNRANL GIRAMHAPNT HHFPLTLASG ESVPLS