Gene NATL1_05061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_05061
Symbol	groEL
ID	4780924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	461078
End bp	462769
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	40%
IMG OID	640083781
Product	chaperonin GroEL
Protein accession	YP_001014333
Protein GI	124025217
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.125633
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAC TTCTAAGTTT TTCAGACGAA TCTCGTGGTG CTCTCGAAAA AGGAGTAAAC 
AATTTAGCCA ACGCTCTAAA AGTCACAATT GGACCTAAAG GTAGAAATGT TGTTATTGAA 
AAAAAATTTG GAGCTCCAGA TATAGTTAAT GATGGAGTAA CTATTGCTAA GGAAATAGAT 
CTTGAAGATC CATTTGAAAA TATAGGAGCA AAGCTCATTG AACAGGTTGC ATCAAAAACG 
AAAGAAAAAG CTGGAGATGG AACAACTACT GCAACAGTTT TAGCTCAATT TATGGTTCAA 
GAGGGTTTGA GAAATACAGC CGCTGGAGCA AGCCCAATCG AATTAAGAAG AGGAATGGAA 
AAGGCTGTAG CTCAAATAGT TGATGATCTA AAGAAAAAAA GCAAATCAGT CAGTGGTGAT 
GCTATAAAAC AAGTTGCGAC AGTAAGTGCC GGTGGAGACG AGGAAATAGG TTCCATGATT 
GCAGATGCAA TAGATAAAGT AAGTTTTGAT GGAGTTATAA CTGTTGAGGA ATCCAAATCT 
CTAGCCACCG AATTAGATAT CACTGAGGGA ATGGCATTTG ACAGAGGATA TAGCTCTCCA 
TATTTTGTGA CAGATGAAGA TCGATTAATT TGCGAATTTG AAAATCCTTC AATCCTAATT 
ACTGACAAAA AGATTTCATC AATTGCCGAT CTCATTCCTG TTCTAGAAAC AGTTCAAAAG 
AACGGAACAC CATTAATAAT TCTTGCAGAA GAAGTAGAGG GTGAAGCATT AGCCACATTA 
GTAGTAAATA AAAATCGTGG TGTTTTACAA GTAGCAGCTG TTAGAGCTCC ATCATTTGGC 
GAGAGACGAA AAGCAGCTCT TGGAGATATT GCGGTATTAA CTGGTGGCAC ATTAATAAGC 
GAAGACAAAG CAATGAGTCT TGAGAAAGTT CAAATTTCTG ACCTAGGTCA AGCAAGAAGA 
GTAACAATTA CAAAAGACAG TACAACAATT GTCGCAAATG ATAATCAAAA CACCGAACTA 
TCTAATCGCA TTGCATCAAT CAAGAGAGAA CTTGACGAAA CAGACTCTGA GTACGATCAA 
GAGAAGTTAA ATGAGAGAAT AGCTAAACTT GCTGGGGGTG TAGCTGTAAT TAAAGTCGGA 
GCTCCAACTG AAACTGAGTT AAAAAACAGA AAGCTCAGAA TTGAGGATGC TCTGAATGCA 
ACTCGTGCAG CCATTGAAGA AGGTATTGTT GCAGGTGGTG GAACAACTCT TTTAGAACTG 
AGTGAAGGGC TTGGAGATTT AGCTAAAAAG CTAGAGGGTG ATCAGAAGAC TGGAGTTGAA 
ATTATAAAAA GAGCATTGAC TGCTCCAACA AAACAGATAG CGATAAATGC TGGATTTAAC 
GGAGATGTTG TTGTTTCAGA TATCAAGCGT TTAGGCAAAG GCTTCAATGC ACAAACTGGA 
GAGTACGTGG ATTTGCTTGA AGCAGGAATC TTAGATGCTT CAAAAGTAAT ACGACTTGCT 
CTTCAAGATG CTGTATCAAT TGCCTCACTG CTCATAACTA CTGAAGTTGT TATTGCTGAC 
AAACCTGAGC CCCCATCAGC GCCAGGAGCT GAAGGTGGAG ATCCAATGGG CGGAATGGGC 
GGAATGGGCG GTATGGGCGG TATGGGCGGT ATGGGCGGTA TGGGCGGTAT GGGAATGCCT 
GGAATGATGT AA

Protein sequence

MAKLLSFSDE SRGALEKGVN NLANALKVTI GPKGRNVVIE KKFGAPDIVN DGVTIAKEID 
LEDPFENIGA KLIEQVASKT KEKAGDGTTT ATVLAQFMVQ EGLRNTAAGA SPIELRRGME 
KAVAQIVDDL KKKSKSVSGD AIKQVATVSA GGDEEIGSMI ADAIDKVSFD GVITVEESKS 
LATELDITEG MAFDRGYSSP YFVTDEDRLI CEFENPSILI TDKKISSIAD LIPVLETVQK 
NGTPLIILAE EVEGEALATL VVNKNRGVLQ VAAVRAPSFG ERRKAALGDI AVLTGGTLIS 
EDKAMSLEKV QISDLGQARR VTITKDSTTI VANDNQNTEL SNRIASIKRE LDETDSEYDQ 
EKLNERIAKL AGGVAVIKVG APTETELKNR KLRIEDALNA TRAAIEEGIV AGGGTTLLEL 
SEGLGDLAKK LEGDQKTGVE IIKRALTAPT KQIAINAGFN GDVVVSDIKR LGKGFNAQTG 
EYVDLLEAGI LDASKVIRLA LQDAVSIASL LITTEVVIAD KPEPPSAPGA EGGDPMGGMG 
GMGGMGGMGG MGGMGGMGMP GMM