Gene BBta_3034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_3034
Symbol	groEL
ID	5150367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	3169771
End bp	3171393
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	66%
IMG OID	640557906
Product	chaperonin GroEL
Protein accession	YP_001239060
Protein GI	148254475
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.398943
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCCA AGGACGTGAA GTTTTCGACC GACGCGCGCG ACCGCATGCT GCGCGGCGTC 
GACATCCTCG CCAATGCGGT CAAGGTCACG CTCGGCCCCA AGGGCCGCAA CGTCGTGATC 
GAGAAATCGT TCGGCGCGCC GCGCATCACC AAGGACGGCG TCACGGTCGC CAAGGAGATC 
GAGCTCGAGG ACAAGTTCGA GAACATGGGC GCGCAGATGG TGCGCGAGGT GGCCTCGAAG 
ACCGCCGATC TCGCCGGCGA CGGCACCACC ACCGCCACCG TGCTCGCCCA GGCGATCGTG 
AAGGAAGGCG CGAAGTCGGT CGCCGCCGGC ATGAACCCGA TGGACCTCAA GCGCGGCATC 
GACCTCGCGG TCGACGCCAT CGTGGCCGAC CTGAAGGCGC ACGCCAAGAA GATCACCAGC 
AATGACGAGA TCGCCCAGGT CGGCACCATC TCGGCCAATG GCGACAACGA GATCGGCCGC 
TTCCTGGCCG AGGCCATGCA GAAAGTCGGC AATGAGGGCG TGATCACGGT CGAGGAGGCC 
AAGAGCCTCG ACACCGAGCT CGAAGTGGTC GAGGGCATGC AGTTCGACCG TGGCTATGTC 
TCGCCATACT TCGTCACCAA TTCCGAGAAG ATGCGGGTCG AGCTCGAGGA TCCCTATATT 
CTGATCCACG AGAAGAAGCT GTCGGGCCTG CAGACCATGC TGCCGCTGCT CGAAGCGGTG 
GTGCAGTCCG GCAAGCCGCT CTTGATCGTC GCCGAGGACG TTGAAGGCGA GGCGCTGGCG 
ACCTTGGTCG TCAACAAGCT GCGCGGCGGC CTCAAGATCG CCGCCGTCAA GGCGCCGGGC 
TTCGGCGATC GCCGCAAGGC GATGCTGGAG GACATCGCGA TCCTCACCGG CGGCACCACG 
ATATCAGAGG ATCTCGGCAT CAAGCTGGAG AACGTGACCC TGTCGATGCT CGGCCGCGCC 
AAGAAGGTCG TCATCGACAA GGAAAACACC ACCATCGTCG ATGGTGCCGG CGCCAAGAAG 
GACATCGAGG CGCGCACGCA GCAGATCAAG CTGCAGATCG AGGAGACCAC CTCCGACTAT 
GACCGCGAGA AGCTGCAGGA GCGGCTGGCC AAGCTCGCCG GCGGCGTCGC GGTGATCAGG 
GTCGGCGGCG CCACCGAGGT CGAGGTCAAG GAGCGCAAGG ACCGCGTCGA CGATGCGCTG 
CATGCCACGC GCGCGGCTGT CGAGGAGGGC ATCCTGCCCG GCGGCGGCGT GGCGCTGTTG 
CGCGCCACCA AGGTGCTCGA CGGCGTCAAG ACCGCCAATG CCGACCAGAA GGCCGGGGTC 
GACATCATCC GCCGCGCCAT CCAGGTGCCG GTGCGGCAGA TCGTGCAGAA CGCCGGCGAG 
GACGGCTCGC TGGTGGTCGG CAAGCTCCTG GAGAAGGACA CCTACAGCTG GGGCTTCAAC 
GCCGCGACCG GCGAGTACCA GGATCTGGTG CAGGCCGGCG TGATCGACCC GGCCAAGGTG 
GTCCGCACCG CGCTGCAGGA TGCGGCCTCG GTCGCCTCGC TGCTGATCAC CACCGAGGCG 
CTGGTTGCCG ACAAGCCGAA GAAGGCGGAG GCCACGCAGG CAGCGCCGGC GATGGACTTC 
TGA

Protein sequence

MAAKDVKFST DARDRMLRGV DILANAVKVT LGPKGRNVVI EKSFGAPRIT KDGVTVAKEI 
ELEDKFENMG AQMVREVASK TADLAGDGTT TATVLAQAIV KEGAKSVAAG MNPMDLKRGI 
DLAVDAIVAD LKAHAKKITS NDEIAQVGTI SANGDNEIGR FLAEAMQKVG NEGVITVEEA 
KSLDTELEVV EGMQFDRGYV SPYFVTNSEK MRVELEDPYI LIHEKKLSGL QTMLPLLEAV 
VQSGKPLLIV AEDVEGEALA TLVVNKLRGG LKIAAVKAPG FGDRRKAMLE DIAILTGGTT 
ISEDLGIKLE NVTLSMLGRA KKVVIDKENT TIVDGAGAKK DIEARTQQIK LQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGATEVEVK ERKDRVDDAL HATRAAVEEG ILPGGGVALL 
RATKVLDGVK TANADQKAGV DIIRRAIQVP VRQIVQNAGE DGSLVVGKLL EKDTYSWGFN 
AATGEYQDLV QAGVIDPAKV VRTALQDAAS VASLLITTEA LVADKPKKAE ATQAAPAMDF