Gene SAG2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG2074
Symbol	groEL
ID	1014885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	2056140
End bp	2057762
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	41%
IMG OID	637317240
Product	chaperonin GroEL
Protein accession	NP_689060
Protein GI	22538209
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.169869
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAG ATATTAAATT TTCAGCAGAT GCCCGCTCAG CAATGGTGCG TGGTGTTGAT 
ATTTTAGCTG ATACAGTCAA AGTAACATTA GGTCCTAAAG GCCGTAATGT TGTTCTTGAA 
AAAGCATTTG GTTCTCCTTT AATTACAAAT GATGGTGTGA CAATTGCTAA AGAAATTGAG 
CTAGAAGATC ACTTTGAAAA TATGGGAGCT AAACTTGTGT CAGAAGTGGC TTCAAAAACT 
AATGATATTG CAGGGGATGG CACTACAACT GCTACTGTTT TGACCCAAGC TATTGTACGG 
GAAGGTCTTA AAAATGTAAC TGCAGGGGCA AATCCGATTG GCATTCGTCG TGGTATTGAA 
ACAGCTGTTT CAGCAGCAGT TGAAGAGCTA AAAGAGATTG CACAACCAGT TTCAGGCAAA 
GAAGCTATTG CTCAAGTTGC GGCTGTGTCT TCACGTTCTG AAAAAGTTGG GGAATACATT 
TCTGAAGCTA TGGAGCGCGT GGGTAATGAT GGTGTTATCA CTATTGAAGA ATCGCGAGGT 
ATGGAAACAG AGCTTGAAGT TGTGGAAGGA ATGCAGTTTG ACCGTGGGTA CTTGTCACAG 
TATATGGTAA CTGATAACGA GAAAATGGTC TCTGAACTTG AGAATCCGTA TATCCTTATT 
ACAGATAAGA AAATTTCAAA TATCCAAGAA ATTTTACCAT TATTAGAAGA GGTTCTTAAA 
ACAAATCGTC CGTTGCTAAT CATCGCTGAT GATGTTGATG GAGAAGCTCT CCCAACGCTT 
GTTCTTAACA AAATTCGTGG AACTTTCAAT GTCGTAGCTG TTAAAGCGCC TGGATTTGGT 
GATCGTCGTA AAGCCATGCT GGAAGATATT GCTATCCTAA CAGGAGGAAC TGTCGTTACT 
GAAGACCTTG GTTTAGACTT AAAAGATGCT ACTATGCAAG TTTTAGGACA GTCTGCTAAA 
GTAACAGTAG ATAAAGATTC TACTGTTATT GTCGAAGGTG CCGGTGACTC ATCAGCAATT 
GCTAATCGCG TAGCTATCAT TAAGTCACAG ATGGAGGCTA CAACTTCTGA TTTTGATCGT 
GAAAAATTAC AAGAACGACT TGCTAAGTTA GCCGGTGGTG TAGCAGTAAT TAAAGTTGGT 
GCAGCGACTG AAACAGAATT AAAAGAGATG AAACTTCGCA TCGAAGATGC GTTAAATGCA 
ACGCGTGCTG CAGTTGAAGA AGGTATTGTT TCAGGTGGAG GTACGGCTCT TGTGAACGTT 
ATTGAAAAAG TAGCGGCACT GAAACTTAAT GGTGATGAGG AGACTGGACG TAATATTGTT 
CTTCGTGCTC TCGAAGAGCC TGTTCGTCAA ATTGCTTACA ATGCTGGATA TGAAGGTTCA 
GTTATTATTG AACGTTTAAA ACAGTCTGAA ATTGGTACAG GATTTAATGC GGCCAATGGA 
GAATGGGTAG ATATGGTTAC CACAGGTATC ATTGACCCTG TCAAAGTAAC ACGTTCTGCA 
CTTCAAAATG CGGCATCTGT AGCAAGTCTT ATCTTGACTA CAGAAGCAGT AGTAGCAAAT 
AAACCTGAAC CAGAAGCTCC TACAGCTCCT GCAATGGATC CATCTATGAT GGGTGGCTTC 
TAA

Protein sequence

MAKDIKFSAD ARSAMVRGVD ILADTVKVTL GPKGRNVVLE KAFGSPLITN DGVTIAKEIE 
LEDHFENMGA KLVSEVASKT NDIAGDGTTT ATVLTQAIVR EGLKNVTAGA NPIGIRRGIE 
TAVSAAVEEL KEIAQPVSGK EAIAQVAAVS SRSEKVGEYI SEAMERVGND GVITIEESRG 
METELEVVEG MQFDRGYLSQ YMVTDNEKMV SELENPYILI TDKKISNIQE ILPLLEEVLK 
TNRPLLIIAD DVDGEALPTL VLNKIRGTFN VVAVKAPGFG DRRKAMLEDI AILTGGTVVT 
EDLGLDLKDA TMQVLGQSAK VTVDKDSTVI VEGAGDSSAI ANRVAIIKSQ MEATTSDFDR 
EKLQERLAKL AGGVAVIKVG AATETELKEM KLRIEDALNA TRAAVEEGIV SGGGTALVNV 
IEKVAALKLN GDEETGRNIV LRALEEPVRQ IAYNAGYEGS VIIERLKQSE IGTGFNAANG 
EWVDMVTTGI IDPVKVTRSA LQNAASVASL ILTTEAVVAN KPEPEAPTAP AMDPSMMGGF