Gene P9301_04761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_04761
Symbol	groEL
ID	4912653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	416187
End bp	417932
Gene Length	1746 bp
Protein Length	581 aa
Translation table	11
GC content	38%
IMG OID	640160054
Product	chaperonin GroEL
Protein accession	YP_001090700
Protein GI	126695814
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAAC AGTTAAGTTT TTCTAATGAG TCAAGAGAAG CGCTAGAAAA AGGTGTGAAT 
TTCGTAGCTA ATGCAGTAAA GGTTACTATT GGGCCAAAAG CAAAAAACGT TGTAATAGAG 
AAGAAATTTG GTTCGCCAGA TATAGTAAGA GATGGATCTA CAGTTGCTAA AGAGATCGAG 
ATTGAAAACC CCATCTCTAA TTTAGGTGCG AAATTAATAG AACAAGTTGC ATCCAAGACA 
AAAGAGAGTG CTGGTGATGG AACAACAACA GCAACCATTT TGACTCAGAA GATGGTTCAG 
GAGGGTTTGA AAAATATTGC CTCTGGCGCA AACCCTATGG AGTTAAAAAA AGGTATGGAG 
GCAGGCCTAT CTTTTGTCTT AGAAAAATTA AGTTCCAAAA GTATTTCATT AAGTGGTTCT 
GACATCCAAA AAGTTGCAAC AGTTAGTGCT GGAGGTGATG AAGAAATTGG ATCTATAATT 
TCGAAAGCAA TGGATATTGT TACTTCAGAT GGTGTAATAA CTGTCGAAGA ATCGCAATCA 
TTAGAAACAG AATTAGATAT AACTGAAGGT ATGTCTTTTG ATAGAGGTTA TAGTTCTCCA 
TATTTTGTAA CGGACCAAGA AAGACAAGTT TGTGAACTTG AAAATCCAAA AATATTAATA 
ACTGATCAAA AAATCTCAAC TTTAGTTGAT CTAGTTCCAA TACTTGAAGA AATTCAGAAG 
TCAGGCTCAC CTTTTCTAAT TCTTGCTGAA GATATCGAAG GAGAGGCTTT AACTACTCTA 
GTTTTAAATA AGAATAGTGG GGTTTTAAAT GTTGCTTCCG TAAGGGCTCC ATTATTTGGT 
GAGAGAAGAA AAGCTGCCCT CGAAGATATT GCAATTCTTA CAGGGGCTAA GTTAATTAGC 
GAAGATAAAT CGATGACACT TGATAAAGTA TCGATTAACG ATTTAGGTAA AGCAAAAAAA 
ATAACTATCA CAAAGGACAA AACTACAATT GTTGCCTTCG AAGACACTAA AGATTTAGTT 
AAAGGGAGAG TAGAGAAATT AAAGAGAGAA GTTAATATAA CTGAATCTGA GTATGATCAA 
GATAAAATCA ATGAAAGGAT AGCCAAACTA GCTGGAGGAG TAGCTCTTAT CAAAGTAGGA 
GCTGCCACAG AAACAGAGAT GAAGTATAAA AAATTGAGAA TCGAAGATTC CCTTAATGCT 
ACGAAAGCTG CTATTGAAGA GGGTGTTGTT TCTGGAGGAG GACAAACTCT AATTGAAATA 
TCAGATGACC TTTTAAATTT AAGTAAAACA TCTACAGATG ATTTAAGAAC AGGGATAAAT 
ATAGTCAAAG AAGCCCTCTT GGAACCCACC AAACAAATAG CAAAAAATGC TGGTTTTAAT 
GGAGATGTAG TTGTCGCTGA AATTAAAAGA CTTAACAAAG GCTTTAATGC TAATTCAGGA 
AAATATGAGG ACTTAAAAGA TTCAGGGATA TTAGATCCAA CCAAAGTAAT AAGATTAGCT 
CTTCAAGATT CAGTATCTAT TGCAGCTATG CTCCTCACAA CAGAAGTTGC GATGGCAGAC 
ATTCCAGAGC CTGAAGCCGC AGGCCCTGGA GGACCAGGTG CAGATCCAAT GGGAGGAATG 
GGTGGCATGG GAATGCCAGG TATGGGTGGC ATGGGAATGC CAGGTATGGG TGGCATGGGA 
ATGCCAGGTA TGGGTGGCAT GGGAATGCCA GGTATGGGTG GCATGGGAAT GCCAGGTATG 
ATGTAG

Protein sequence

MAKQLSFSNE SREALEKGVN FVANAVKVTI GPKAKNVVIE KKFGSPDIVR DGSTVAKEIE 
IENPISNLGA KLIEQVASKT KESAGDGTTT ATILTQKMVQ EGLKNIASGA NPMELKKGME 
AGLSFVLEKL SSKSISLSGS DIQKVATVSA GGDEEIGSII SKAMDIVTSD GVITVEESQS 
LETELDITEG MSFDRGYSSP YFVTDQERQV CELENPKILI TDQKISTLVD LVPILEEIQK 
SGSPFLILAE DIEGEALTTL VLNKNSGVLN VASVRAPLFG ERRKAALEDI AILTGAKLIS 
EDKSMTLDKV SINDLGKAKK ITITKDKTTI VAFEDTKDLV KGRVEKLKRE VNITESEYDQ 
DKINERIAKL AGGVALIKVG AATETEMKYK KLRIEDSLNA TKAAIEEGVV SGGGQTLIEI 
SDDLLNLSKT STDDLRTGIN IVKEALLEPT KQIAKNAGFN GDVVVAEIKR LNKGFNANSG 
KYEDLKDSGI LDPTKVIRLA LQDSVSIAAM LLTTEVAMAD IPEPEAAGPG GPGADPMGGM 
GGMGMPGMGG MGMPGMGGMG MPGMGGMGMP GMGGMGMPGM M