Gene Syncc9902_1747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_1747
Symbol	groEL
ID	3742157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	1679160
End bp	1680848
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	56%
IMG OID	637771938
Product	chaperonin GroEL
Protein accession	YP_377748
Protein GI	78185313
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAAC TTCTTTCTTT CTCCGACGAA TCACGCAGTT CCCTTGAGCG TGGTGTGAAC 
GCCCTTGCCA ATGCTGTCCG AGTCACCATC GGACCCAAGG GTCGGAATGT CGTTCTCGAG 
AAGAAATTTG GCGCCCCAGA CATCGTTAAT GACGGCGATA CCATTGCCCG CGATATCGAG 
CTGGAAGATC CTTTTGAAAA TCTCGGCGCC AAGCTGATTC AACAGGTGGC ATCCAGAACT 
AAAGACAAAG CTGGAGACGG CACCACCACG GCCACGGTTT TAGCTCAGGC CATGGTTCGC 
GAAGGACTCC GCAACACAGC AGCAGGAGCT AGCCCTGTAG AGCTTCGTCG TGGGATGGAG 
AAAGCGGCAG CACAGGTGGT TGCCGGTTTG GCGAGCCGAA GTCAGGCCGT CGAAGGTGAT 
TCCATCCAAC AGGTGGCCAC GGTGAGTTCC AGTGGCGATG AAGAAGTGGG TCGGATGATC 
GCTGAAGCGA TGGATCGGGT CAGCGTGGAC GGCGTCATCA CCGTTGAAGA ATCCAAATCG 
CTCGCCACCG AAATGGAGGT GACTGAAGGC ATGGCATTCG ATCGCGGATA CAGCTCGCCC 
TATTTCGTCA CGGATGCTGA TCGTCAGGTT TGTGAATTCG AAAATCCATT GATCCTGCTG 
ACCGATCGAA AGATCAGCAC CGTCATCGAT TTAGTGCCCG TTCTTGAAGC GGTTCAAAAA 
AGTGGCTCGC CGCTTTTAAT CCTCTCGGAA GAGGTGGAGG GGGAAGCCCT GGCCACCTTG 
GTGATGAACA AGAGCCGTGG CGTCCTCCAA GTGGCAGCAG TGCGTGCTCC TTCCTTCGGA 
GACCGTCGCA AAGCAGCCTT GGCTGATATC GCCATCCTCA CGGGGGGCAC CTTAATCAGC 
GAAGACCAAG CGATGACTCT CGACAAGGTG ACGCTCGAGG ATCTCGGTCA CGCCCGTCGG 
GTGACGATCA GCAAAGAGAG CACCACCATC GTTGCGAATG ACAATCACAG TGAAGCGGTG 
AGCAATCGTG TTGCCGCAAT CAAGCGAGAG CTCGACGCGA CAGAGTCGGA TTACGACCGC 
GAAAAGCTGA ATGAGCGGAT TGCCAAACTG GCCGGTGGTG TTGCCGTCAT CAAGGTGGGT 
GCTGCAACAG AAACCGAACT GAAAAACCGC AAACTGCGAA TTGAAGACGC CCTGAATGCC 
ACCCGTGCCG CTGTGGAAGA AGGAATCGTG GCTGGAGGCG GAAGCACGTT GCTTCAGCTC 
GCTGAAGACC TCAACGCCCT AGCGGCACAA CTGGACGGCG ATCAACGCAC CGGCGTAGAA 
ATTGTGCAGC GATCACTCAC CGCACCCGTC CACCAGATCG CAACCAATGC AGGACATAAC 
GGTGACGTGG TGATCGAAAC GATGCGCCAA AGCGGTCAGG GATTCAATGC CCTAACGGGT 
GTGTACGAAG ACTTGATGGC GACAGGCATC GTTGATGCCA CCAAAGTTGT TCGACTTGCA 
GTACAGGACG CGGTGTCGAT TGCATCCCTG CTGGTCACAA CTGAGGTAGT GATTGCTGAC 
AAACCAGAAC CAGAACCTCC TGCTGGAGCT GGAGGTGAAG ATCCCATGGG TGGAATGGGC 
GGCATGGGTG GCATGGGCGG TATGGGTATG CCTGGCATGG GCGGCATGGG CATGCCTGGA 
ATGATGTGA

Protein sequence

MAKLLSFSDE SRSSLERGVN ALANAVRVTI GPKGRNVVLE KKFGAPDIVN DGDTIARDIE 
LEDPFENLGA KLIQQVASRT KDKAGDGTTT ATVLAQAMVR EGLRNTAAGA SPVELRRGME 
KAAAQVVAGL ASRSQAVEGD SIQQVATVSS SGDEEVGRMI AEAMDRVSVD GVITVEESKS 
LATEMEVTEG MAFDRGYSSP YFVTDADRQV CEFENPLILL TDRKISTVID LVPVLEAVQK 
SGSPLLILSE EVEGEALATL VMNKSRGVLQ VAAVRAPSFG DRRKAALADI AILTGGTLIS 
EDQAMTLDKV TLEDLGHARR VTISKESTTI VANDNHSEAV SNRVAAIKRE LDATESDYDR 
EKLNERIAKL AGGVAVIKVG AATETELKNR KLRIEDALNA TRAAVEEGIV AGGGSTLLQL 
AEDLNALAAQ LDGDQRTGVE IVQRSLTAPV HQIATNAGHN GDVVIETMRQ SGQGFNALTG 
VYEDLMATGI VDATKVVRLA VQDAVSIASL LVTTEVVIAD KPEPEPPAGA GGEDPMGGMG 
GMGGMGGMGM PGMGGMGMPG MM