Gene Syncc9902_2036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_2036
Symbol
ID	3742996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	1945429
End bp	1946508
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	58%
IMG OID	637772233
Product	photosystem II reaction centre protein PsbA/D1
Protein accession	YP_378037
Protein GI	78185603
COG category
COG ID
TIGRFAM ID	[TIGR01151] photosystem II, DI subunit (also called Q(B))

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACCA CCATCCAGCA GCGCTCCGGC GCTTCTAGCT GGCAGTCCTT CTGCGAGTGG 
GTCACCTCCA CCAACAACCG TCTGTATGTC GGTTGGTTCG GTGTGCTGAT GATCCCAACT 
CTGTTGGCTG CCACCATCTG CTTCGTCATC GCATTCGTCG CCGCTCCTCC GGTTGACATC 
GATGGCATCC GCGAGCCTGT CGCTGGCTCC TTGATGTACG GCAACAACAT CATCTCTGGT 
GCTGTTGTTC CTTCCAGCAA CGCCATTGGC TTGCACTTCT ATCCCATCTG GGAAGCAGCT 
TCACTCGACG AGTGGCTGTA CAACGGCGGT CCTTTCCAGC TCGTCGTCTT CCACTTCCTC 
ATCGGCATCT ACGCCTACAT GGGTCGTGAG TGGGAACTCT CTTACCGCTT GGGCATGCGC 
CCTTGGATCT GTGTTGCATA CAGCGCACCT GTCGCTGCTG CATCTGCAGT CTTCCTCGTC 
TACCCCTTCG GTCAGGGTTC GTTCTCTGAT GCAATGCCCC TGGGCATCTC TGGAACCTTC 
AACTACATGT TGGTGTTCCA GGCTGAGCAC AACATCCTGA TGCACCCCTT CCACATGCTG 
GGTGTTGCAG GCGTCTTCGG CGGCAGCTTG TTCTCCGCCA TGCACGGCTC ACTGGTGACC 
TCCTCCTTGG TGCGTGAAAC CACCGAAAGC GAGTCCCAGA ACTACGGCTA CAAATTCGGC 
CAAGAAGAAG AGACGTACAA CATCGTGGCT GCTCACGGCT ACTTCGGTCG CCTGATCTTC 
CAATACGCCT CCTTCAACAA CAGCCGTAGC CTCCACTTCT TCCTGGCTGC CTGGCCCGTT 
GTCGGCATCT GGTTCACCGC CCTTGGCGTG TCAACCATGG CCTTCAACCT GAACGGCTTC 
AACTTCAACC AGTCCATCCT TGATGGTCAG GGCCGCGTCC TGAACACCTG GGCCGACGTG 
TTGAACCGTG CAGGCCTCGG CATGGAAGTC ATGCACGAGC GCAACGCTCA CAACTTCCCC 
CTCGACCTGG CAGCTGCTGA GTCCACACCT GTGGCACTGC AAGCACCTGC AATCGGTTGA

Protein sequence

MTTTIQQRSG ASSWQSFCEW VTSTNNRLYV GWFGVLMIPT LLAATICFVI AFVAAPPVDI 
DGIREPVAGS LMYGNNIISG AVVPSSNAIG LHFYPIWEAA SLDEWLYNGG PFQLVVFHFL 
IGIYAYMGRE WELSYRLGMR PWICVAYSAP VAAASAVFLV YPFGQGSFSD AMPLGISGTF 
NYMLVFQAEH NILMHPFHML GVAGVFGGSL FSAMHGSLVT SSLVRETTES ESQNYGYKFG 
QEEETYNIVA AHGYFGRLIF QYASFNNSRS LHFFLAAWPV VGIWFTALGV STMAFNLNGF 
NFNQSILDGQ GRVLNTWADV LNRAGLGMEV MHERNAHNFP LDLAAAESTP VALQAPAIG