Gene Syncc9605_2375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_2375
Symbol
ID	3736539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	-
Start bp	2189051
End bp	2190106
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	60%
IMG OID	637776963
Product	photosystem II D2 protein (photosystem q(a) protein)
Protein accession	YP_382662
Protein GI	78213883
COG category
COG ID
TIGRFAM ID	[TIGR01151] photosystem II, DI subunit (also called Q(B)) [TIGR01152] Photosystem II, DII subunit (also called Q(A))

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.116163
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCG CTGTAGGACG CGCGCCACAG CGGGGATGGT TTGACGTCCT CGATGACTGG 
CTCAAGCGCG ACCGCTTCGT TTTTGTCGGC TGGTCCGGCA TTCTTCTCCT CCCAACGGCC 
TACCTGGCCA TCGGTGGCTG GCTGACAGGC ACCACTTTTG TCACCTCCTG GTACACCCAC 
GGCATTGCCT CGTCGTACCT GGAAGGTTGC AACTTCCTGA CCGCTGCTGT GTCCACCCCC 
GCTGATGCGA TGGGTCACAG CCTGCTGCTG CTCTGGGGCC CTGAGGCTCA GGGCGACTTC 
GTTCGCTGGT GTCAGCTCGG CGGCCTCTGG GCCTTCGTGG CTCTGCACGG CGCCTTCGCA 
CTGATCGGCT TCATGCTCCG TCAGTTCGAG ATCGCTCGTC TGGTCGGCAT CCGCCCTTAC 
AACGCCATCG CCTTCTCCGG TCCGATTGCG GTGTTCGTCA GTGTCTTCCT GATGTACCCC 
CTCGGCCAGA GCAGCTGGTT CTTCGCGCCC TCCTTCGGTG TGGCTGCGAT CTTCCGCTTC 
CTTCTCTTCC TTCAGGGCTT CCACAACTGG ACCCTGAACC CCTTCCACAT GATGGGCGTC 
GCCGGCATCC TCGGCGGTGC ACTCCTCTGT GCTATTCACG GCGCCACCGT GGAAAACACC 
CTGTTTGAGG ACGGTGAGCA GGCCAACACC TTCAAGGCGT TCGAGCCCAC TCAGGAAGAA 
GAGACCTATT CCATGGTCAC CGCCAACCGC TTCTGGAGCC AGATCTTCGG TATCGCCTTC 
TCCAACAAGC GCTGGCTGCA CTTCTTCATG CTGTTCGTGC CTGTGATGGG CCTATGGACC 
AGCTCCATCG GCATCATTGG CCTGGCCCTC AACCTGCGCG CCTATGACTT CGTGTCCCAG 
GAAATCCGCG CTGCAGAAGA TCCCGAATTC GAGACCTTCT ACACCAAGAA CATCCTTCTG 
AATGAAGGTC TGCGTGCCTG GATGGCACCG GCTGACCAGC CGCACGAAAA CTTCGTCTTC 
CCTGAAGAGG TTCTGCCACG CGGCAACGCC CTTTGA

Protein sequence

MTIAVGRAPQ RGWFDVLDDW LKRDRFVFVG WSGILLLPTA YLAIGGWLTG TTFVTSWYTH 
GIASSYLEGC NFLTAAVSTP ADAMGHSLLL LWGPEAQGDF VRWCQLGGLW AFVALHGAFA 
LIGFMLRQFE IARLVGIRPY NAIAFSGPIA VFVSVFLMYP LGQSSWFFAP SFGVAAIFRF 
LLFLQGFHNW TLNPFHMMGV AGILGGALLC AIHGATVENT LFEDGEQANT FKAFEPTQEE 
ETYSMVTANR FWSQIFGIAF SNKRWLHFFM LFVPVMGLWT SSIGIIGLAL NLRAYDFVSQ 
EIRAAEDPEF ETFYTKNILL NEGLRAWMAP ADQPHENFVF PEEVLPRGNA L