Gene P9211_04501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_04501
Symbol	groEL
ID	5731113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	424806
End bp	426503
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	42%
IMG OID	641284807
Product	chaperonin GroEL
Protein accession	YP_001550335
Protein GI	159902991
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.383214
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAAC TCCTTAGTTC TTCAGATGAA TCTAGAGGCG CCCTTGAGAA AGGGGTAGAT 
GCACTTGCCA ACGCAGTAAA GGTAACCATT GGTCCCAAAG GCAGAAATGT AGTACTAGAA 
AAGAAGTTTG GAGCTCCAGA TATAGTTAAC GATGGGGTCT CCATAGCCAA AGACATAGAA 
CTAGAAGACC CCTTTGAAAA CTTAGGTGCA AAGCTTATTG AGCAGGTTGC TTCTAAAACG 
AAAGATAAAG CTGGTGATGG CACAACAACA GCCACTGTTT TAGCTCAAGT AATGGTTCAT 
GAGGGACTAA AAAATACTGC CGCAGGGGCA AGCCCTATCG AGCTTCGTCG TGGCATGGAA 
AAAGCAGTTT CATTCATAGT TGAAAAATTG CAACAAAAAA GTAAAGGCAT AAGTGGCAAT 
GAAATTCTTC AAGTAGCAAC GGTTAGTTCG GGTGGTGATG AAGAGATCGG GGAAATGGTG 
GCTGAGGCCA TGGAGAAAGT CAGTGTAGAT GGTGTAATTA CAGTCGAAGA ATCAAAGTCC 
TTAAACACTG AGCTGGAAAT AACCGAAGGG ATGGCTTTTG ATAGAGGTTA TAGTTCGCCT 
TACTTTGTTA CTGATGCTGA CCGTCAAATT TGCGAGTTTG AAAACCCTTT ACTCTTAATA 
ACCGATAGAA AAATTAGCTC CATAGGTGAC CTAGTCCCTG TTTTAGAAGC AGTCCAAAAA 
AGTGGCTCTC CTTTAGTGAT TCTTTCTGAA GAAGTTGAAG GAGAAGCATT GGCAACTTTA 
GTAGTAAATA AAAATCGTGG AGTTTTACAA GTAGCAGCTG TTCGCGCCCC ATCATTTGGG 
GAAAGGCGTA AAGCAGCTCT TGCAGATATT AGTGTTCTAA CTGGAGGGAC ATTAATAAGC 
GAAGATAAAG CAATGTCATT AGAAAAAGTT TCTCTCTCAG ATTTAGGTAA AGCCAGAAAA 
ATAACCATTA CAAAAGACTC GACAACTATC GTTGCTAATG ATGACCATCG CAAAGCTGTG 
GAGTCACGAG TAGCTTCTAT TAAAAGAGAA TTAGATAGCA CTGATTCTGA TTACGACCGA 
GAGAAGTTGA ATGAGCGAAT AGCAAAACTT GCTGGGGGAG TAGCTGTAAT TAAAGTAGGG 
GCGCCAACTG AAACAGAGTT AAAGAATCGA AAACTTAGGA TTGAAGACGC TTTAAATGCA 
ACTCGTGCTG CAGTAGAAGA AGGAATTGTT GCAGGAGGTG GGAGCACTCT TCTTCAATTA 
AGTAATGAGC TCAATAGTCT TTCAAAAGAG TTAAGTGGTG ATAAGAAAAC TGGAGTTGAC 
ATAATTAAAA AAGCCTTATC AGCTCCAGCC AGGCAAATAG CTGTAAATGC AGGAGAGAAT 
GGAGATGTTG TTGTATCTCA AATTGAACAA CTGGGGAAAG GCTTTAATGC TGCCACAGGA 
CAATATGAGG ACCTTCTTTC CACTGGCATA ATCGATGCAG TGAAAGTAAT ACGACTAGCA 
CTTCAAGATG CAGTTTCAAT CGCTTCACTA ATCATCACTA CAGAAGTAGT AATTGCCGAC 
AAGCCTGAAC CACCAGCAGC TCCAGGGGCA GAAGGGGCTG GAGACCCAAT GGGTGGTATG 
GGTGGTATGG GTGGTATGGG TGGTATGGGT GGTATGATGG GTGGCATGGG TGGCATGGGT 
ATGCCTGGAA TGATGTAA

Protein sequence

MAKLLSSSDE SRGALEKGVD ALANAVKVTI GPKGRNVVLE KKFGAPDIVN DGVSIAKDIE 
LEDPFENLGA KLIEQVASKT KDKAGDGTTT ATVLAQVMVH EGLKNTAAGA SPIELRRGME 
KAVSFIVEKL QQKSKGISGN EILQVATVSS GGDEEIGEMV AEAMEKVSVD GVITVEESKS 
LNTELEITEG MAFDRGYSSP YFVTDADRQI CEFENPLLLI TDRKISSIGD LVPVLEAVQK 
SGSPLVILSE EVEGEALATL VVNKNRGVLQ VAAVRAPSFG ERRKAALADI SVLTGGTLIS 
EDKAMSLEKV SLSDLGKARK ITITKDSTTI VANDDHRKAV ESRVASIKRE LDSTDSDYDR 
EKLNERIAKL AGGVAVIKVG APTETELKNR KLRIEDALNA TRAAVEEGIV AGGGSTLLQL 
SNELNSLSKE LSGDKKTGVD IIKKALSAPA RQIAVNAGEN GDVVVSQIEQ LGKGFNAATG 
QYEDLLSTGI IDAVKVIRLA LQDAVSIASL IITTEVVIAD KPEPPAAPGA EGAGDPMGGM 
GGMGGMGGMG GMMGGMGGMG MPGMM