Gene PCC7424_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC7424_1049
Symbol
ID	7111637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 7424
Kingdom	Bacteria
Replicon accession	NC_011729
Strand	+
Start bp	1150654
End bp	1151724
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	46%
IMG OID	643479319
Product	photosystem q(b) protein
Protein accession	YP_002376371
Protein GI	218438042
COG category
COG ID
TIGRFAM ID	[TIGR01151] photosystem II, DI subunit (also called Q(B))

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.0115915
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTACTA CTTTACAGCA ACGCGAAAGC GTTTCCCTGT GGGAACAGTT TTGTCAGTGG 
ATCACCAGCA CCAACAACCG TTTATACATC GGTTGGTTCG GTGTCATCAT GATCCCCACC 
CTCTTAACTG CTACTACCTG TTTCATCATT GCTTTCATCG CTGCTCCTCC TGTAGACATC 
GATGGAATCC GTGAACCCGT AGCTGGTTCT TTACTCTACG GAAACAACAT CATCTCTGGT 
GCAGTTGTTC CTTCTTCCAA CGCCATTGGA TTACACTTCT ACCCCATTTG GGAAGCCGCT 
TCCTTAGATG AGTGGCTTTA CAACGGTGGC CCTTACCAGT TAGTAGTATT CCACTTCTTA 
ATCGGAGTAT TCTGCTACAT GGGTCGTCAG TGGGAATTAA GCTACCGCTT AGGAATGCGT 
CCTTGGATTT GTGTAGCTTA CTCTGCTCCT GTATCCGCAG CTACCGCAGT ATTCTTAATC 
TACCCCATCG GACAAGGTTC TTTCTCTGAT GGAATGCCTT TAGGAATCAG TGGAACATTC 
AACTTCATGT TCGTTTTCCA AGCAGAACAC AACATCTTAA TGCACCCCTT CCATATGTTG 
GGAGTAGCTG GTGTATTCGG AGGTTCTTTA TTCTCTGCAA TGCACGGAAG CTTAGTAACC 
AGTTCTTTAG TTCGTGAAAC TACCGAAGTA GAATCTCAGA ACTATGGTTA CAAGTTCGGA 
CAAGAAGAAG AAACCTACAA CATCGTAGCA GCACACGGAT ACTTCGGACG TTTAATTTTC 
CAATATGCGT CCTTCAACAA CAGCCGTTCA TTACACTTCT TCTTAGGAGC ATGGCCTGTA 
ATCGGTATCT GGTTCACCGC AATGGGAATC TCTACCATGG CCTTCAACCT CAACGGTTTC 
AACTTCAACC AGTCTATCCT TGATTCTCAA GGTCGTGTCA TCAGCACCTG GGCTGACGTA 
TTAAACCGCG CTAACTTAGG ATTTGAAGTA ATGCACGAGC GCAACGCTCA CAACTTCCCC 
TTAGACTTAG CGTCTGCTGA ACCTGTTGTT GCTCCTTCCA TCAATGGCTA G

Protein sequence

MTTTLQQRES VSLWEQFCQW ITSTNNRLYI GWFGVIMIPT LLTATTCFII AFIAAPPVDI 
DGIREPVAGS LLYGNNIISG AVVPSSNAIG LHFYPIWEAA SLDEWLYNGG PYQLVVFHFL 
IGVFCYMGRQ WELSYRLGMR PWICVAYSAP VSAATAVFLI YPIGQGSFSD GMPLGISGTF 
NFMFVFQAEH NILMHPFHML GVAGVFGGSL FSAMHGSLVT SSLVRETTEV ESQNYGYKFG 
QEEETYNIVA AHGYFGRLIF QYASFNNSRS LHFFLGAWPV IGIWFTAMGI STMAFNLNGF 
NFNQSILDSQ GRVISTWADV LNRANLGFEV MHERNAHNFP LDLASAEPVV APSING