Gene Syncc9902_1864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_1864
Symbol
ID	3742177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	1791891
End bp	1793450
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	56%
IMG OID	637772059
Product	photosystem II chlorophyll-binding protein CP47
Protein accession	YP_377865
Protein GI	78185430
COG category
COG ID
TIGRFAM ID	[TIGR03039] photosystem II chlorophyll-binding protein CP47

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATTGC CCTGGTATCG GGTGCACACC GTCGTCATCA ATGACCCGGG TCGCCTTTTG 
GCGGTGCACC TCATGCATAC AGCCCTCGTT GCCGGCTGGG CCGGCTCCAT GGCTCTGTAC 
GAATTAGCGA TTTTCGATCC ATCCGATGCT GTCCTGAACC CCATGTGGCG TCAGGGCATG 
TTTGTGATGC CCTTCATGTC TCGCCTGGGA GTTACCGGGA GCTGGGGTGG TTGGAGCATC 
ACTGGTGAAA CCGGGGTTGA CCCTGGCTTC TGGAGCTTCG AAGGTGTTGC CGCCGCCCAC 
ATTATTTTTT CAGGCCTGCT GATGCTGGCC GCCATCTGGC ACTGGACCTA CTGGGATCTT 
GAGATCTGGC AGGACCCCAG AACCGGAGAA CCAGCCCTTG ATCTTCCAAA GATTTTTGGC 
ATTCACCTTC TACTAGCTGG CCTTGGCTGC TTTGGATTCG GTGCTTTCCA TCTCACTGGT 
GTTTTTGGGC CTGGCATGTG GATTTCTGAT CCATATGGAA TTACTGGTCA CCTAGAGGCT 
GTACAACCGT CTTGGGGTCC GGAAGGATTC AATCCGTTTA ACCCCGGTGG GATCGTTGCC 
CACCACATTG CAGCTGGAAT TGTCGGCATC ATCGCTGGCA TTTTCCACAT CACCACGCGA 
CCGCCCGAGC GCCTCTACAA GGCTCTCCGG ATGGGCAACA TTGAAACTGT CTTAGCGAGT 
GCAATCGCGG CTGTTTTCTT TGCTGCTTTC ATCGTTGCTG GAACCATGTG GTACGGCTCA 
GCTGCTACCC CAGTCGAGCT TTTCGGCCCT ACTCGTTATC AGTGGGATCA GAGCTACTTC 
AAGACGGAGA TCAACCGTCG CGTTCAAACC GCTATGGACG ACGGTGCAAG CCGTGAAGAA 
GCGTTTGCAG CCATTCCAGA GAAACTGGCG TTCTACGACT ACGTGGGCAA CAGCCCTGCC 
AAGGGTGGAT TGTTCCGAGT TGGCCCGATG GTGAACGGTG ACGGCCTTGC CACTTCATGG 
CTGGGTCACG TTGTGTTCAC CGACAGCAAT GGTCGTGAGT TGCAAGTTCG TCGTCTGCCG 
AATTTCTTCG AGAACTTCCC AGTGATTCTG GAAGACGAGC AAGGCATTGT TCGTGCTGAC 
ATTCCTTTCC GCCGTGCGGA AGCGAAGTAT TCCTTCGAAC AACAAGGCGT TACTGCTCAG 
GTGTTTGGCG GAGCCTTGGA TGGTCAGAAG TTCACGGATC CTGCTGATGT GAAACGTTTG 
GCCCGCAAGT CGCAGTTGGG AGAAGCGTTC GATTTCGATC GCGAAACCTA CAACTCTGAT 
GGTGTCTTCC GCAGTTCACC TCGCGGTTGG TTCACGTTCG GCCACGCCAC CTTCGCGCTG 
CTCTTCTTCT TTGGACACAT TTGGCATGGG GCACGCACCC TGTACCGCGA TGTGTTTGCT 
GGTATCGATC CAGACCTTGG AGACCAGGTG GAATTCGGCC TGTTCGCCAA GCTGGGCGAC 
AAGACCACAC GTCGTCTTCC AGAGGGCTAC GTGCCCCCTG CAGGAACGCC TCTCAACTGA

Protein sequence

MGLPWYRVHT VVINDPGRLL AVHLMHTALV AGWAGSMALY ELAIFDPSDA VLNPMWRQGM 
FVMPFMSRLG VTGSWGGWSI TGETGVDPGF WSFEGVAAAH IIFSGLLMLA AIWHWTYWDL 
EIWQDPRTGE PALDLPKIFG IHLLLAGLGC FGFGAFHLTG VFGPGMWISD PYGITGHLEA 
VQPSWGPEGF NPFNPGGIVA HHIAAGIVGI IAGIFHITTR PPERLYKALR MGNIETVLAS 
AIAAVFFAAF IVAGTMWYGS AATPVELFGP TRYQWDQSYF KTEINRRVQT AMDDGASREE 
AFAAIPEKLA FYDYVGNSPA KGGLFRVGPM VNGDGLATSW LGHVVFTDSN GRELQVRRLP 
NFFENFPVIL EDEQGIVRAD IPFRRAEAKY SFEQQGVTAQ VFGGALDGQK FTDPADVKRL 
ARKSQLGEAF DFDRETYNSD GVFRSSPRGW FTFGHATFAL LFFFGHIWHG ARTLYRDVFA 
GIDPDLGDQV EFGLFAKLGD KTTRRLPEGY VPPAGTPLN