Gene Gdia_0271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0271
Symbol	groEL
ID	6973663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	301840
End bp	303483
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	66%
IMG OID	643389802
Product	chaperonin GroEL
Protein accession	YP_002274683
Protein GI	209542454
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCCA AGGACGTAAA GTTCGGTGGT GACGCACGCC AGCGCATGCT GCGGGGCGTG 
GACATTCTGG CCGACGCGGT GAAGGTGACC CTGGGCCCGA AGGGCCGGAA CGTCGTGCTC 
GACAAGAGCT TCGGCGCGCC GCGCATCACC AAGGACGGCG TTTCCGTCGC CAAGGAAATC 
GAACTGGCCG ACAAGTTCGA GAACATGGGC GCCCAGATGG TGCGCGAAGT GGCGTCGAAG 
ACCAACGACG TCGCCGGTGA CGGCACCACG ACCGCGACCG TTCTGGCCCA GGCCATCGTC 
CGCGAGGGTG CCAAGGCCGT TGCGGCCGGC ATGAACCCGA TGGACCTGAA GCGCGGCATC 
GACAAGGCCG TCATCGCGGT CGTCGAGGAG TTGAAGAAGA ACACCAAGAA GATCACGACC 
CCGGCCGAAA CGGCGCAGGT CGGCACGATC TCGGCCAACG GCGAGCATGA GATCGGCGAG 
ATGATCTCGC AGGCCATGCA GAAGGTCGGC AGCGAAGGCG TCATCACGGT GGAAGAGGCC 
AAGGGCCTGC ACACCGAACT GGACGTCGTC GAGGGCATGC AGTTCGATCG CGGCTATATC 
TCCCCGTATT TCATCACGAA CGCGGAGAAG ATGGTTGCCG ACCTGGACAA CCCCTACATC 
CTGATCCACG AAAAGAAGCT GTCGTCGCTG CAGCCGATGC TGCCGCTGCT GGAGAGCGTC 
GTGCAGTCCG GCCGTCCGCT GCTGATCATC GCCGAGGACG TCGATGGCGA GGCGCTGGCG 
ACCCTGGTCG TCAACAAGCT GCGTGGTGGC CTGAAGATCG CCGCCGTCAA GGCGCCGGGC 
TTCGGTGATC GTCGCAAGGC GATGCTGGAA GACATCGCGA TCCTGACCGG TGGACAGGTC 
ATCAGCGAAG ATCTGGGCAT CAAGCTGGAG ACCGTGACCC TGGCGATGCT GGGCCGTGCG 
AAGAAGGTCC GCATCGAGAA GGAAAACACC ACGATCGTCG AGGGCGCCGG CGCGTCCGAC 
GACATCAAGG GCCGTTGCGG CCAGATCCGC GCGCAGATCG AGGAGACCAC CTCGGACTAC 
GATCGCGAGA AGCTGCAGGA GCGTCTGGCG AAGCTGGCGG GCGGCGTCGC CGTCATCCGC 
GTCGGCGGCT CGACCGAGGT CGAGGTGAAG GAGCGCAAGG ACCGCGTCGA CGACGCGCTG 
CATGCGACCC GCGCCGCGGT CGAGGAAGGC ATCGTCCCCG GCGGCGGCAC GGCGCTGGCG 
CGTGCGTCCA CCGCCCTGGG CAACCTGCAT TTCCACAATG ACGACCAGCG CGTCGGCGCG 
GAAATCATCC GCAAGGCCCT GCAGGCTCCG CTGCGCCAGA TCGCCCACAA CGCGGGCGAA 
GACGGTGCGG TCATCGCCGG CAAGGTGCTG GAAAGCAACG ACTACAACTA CGGCTTCGAC 
GCCCAGATCG GCGATTACAA GGATCTGGTG GCTGCCGGTA TCATCGACCC GACCAAGGTC 
GTGCGGACCG CGCTGCAGGA CGCGTCGTCG GTTGCCGGCC TGCTGATCAC CACCGAGGCG 
ATGGTGGCCG AGAAGCCGGA AAAGAAGGCC CCGGCCATGC CCGCCGGTGG CGGCATGGGC 
GGCATGGGCG ACATGGATTT CTAA

Protein sequence

MAAKDVKFGG DARQRMLRGV DILADAVKVT LGPKGRNVVL DKSFGAPRIT KDGVSVAKEI 
ELADKFENMG AQMVREVASK TNDVAGDGTT TATVLAQAIV REGAKAVAAG MNPMDLKRGI 
DKAVIAVVEE LKKNTKKITT PAETAQVGTI SANGEHEIGE MISQAMQKVG SEGVITVEEA 
KGLHTELDVV EGMQFDRGYI SPYFITNAEK MVADLDNPYI LIHEKKLSSL QPMLPLLESV 
VQSGRPLLII AEDVDGEALA TLVVNKLRGG LKIAAVKAPG FGDRRKAMLE DIAILTGGQV 
ISEDLGIKLE TVTLAMLGRA KKVRIEKENT TIVEGAGASD DIKGRCGQIR AQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGSTEVEVK ERKDRVDDAL HATRAAVEEG IVPGGGTALA 
RASTALGNLH FHNDDQRVGA EIIRKALQAP LRQIAHNAGE DGAVIAGKVL ESNDYNYGFD 
AQIGDYKDLV AAGIIDPTKV VRTALQDASS VAGLLITTEA MVAEKPEKKA PAMPAGGGMG 
GMGDMDF