Gene Gdia_0861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0861
Symbol
ID	6974258
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	978489
End bp	980114
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	66%
IMG OID	643390390
Product	chaperonin GroEL
Protein accession	YP_002275266
Protein GI	209543037
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00285794
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGCA AAGACGTCAA GTTCGCCGGC GACGCACGGG CGCGCCTGCT TTCCGGAATC 
GACACGCTTG CCGACGCGGT CAAGGTGACG CTGGGGCCGA AGGGCCGCAA CGTCGTCATC 
GACAAGAGCT TCGGCGCGCC AAGGATCACC AAGGACGGTG TCACGGTCGC CAAGGAGATC 
GAACTGTCCG ACAAGTTCGA GAACCTGGGC GCGCAGCTTC TGCGTGAGGT CGCCAGCAAG 
ACCAACGACC TGGCGGGCGA CGGGACGACG ACCGCGACCG TCCTGGCGCA GTCCATCGTG 
CGCGAGGGGC TGAAGGCGGT CGCCGCCGGT TTCAACCCGC AGGACGTCAA GCGCGGAATC 
GATCACGCGA CGACCGCGGT GATCGAGGAA CTGCGGACGC GTACCCGCCC GATCGCGACC 
CGGGAGGAAA CCGCCCAGGT GGCCACGATT TCGGCCAACG GCGAGGTGGA AATCGGCCGC 
ATCATTTCCG AGGCGGTGCA GAAGGTCGGC AAGGACGGTG TGATCACCGT CGAGGAAGCC 
AAGGGATTCG AGACCGAACT GGACGTAGTC GAGGGGTTGC AGTTCGACCG GGGCTATATC 
TCGCCCTATT TCGTGACGAA CAGCGAGAAG CTGATCGCGG ACCTGGAAAA TCCCTATATC 
CTGATCCATG AAAAGAAGCT GTCGTCGCTG CAGCCCCTGC TGCCGCTGCT GGAGAACGTG 
GTCAAATCCG GGCGCCCGCT GCTGAGCATC GCCGAGGATG TCGAGGGCGA GGCCCTGGCG 
ACCCTGGTGG TGAACAAGTT GCGCGGCGGG CTGAAGATCG CGGCTGTCAA GGCGCCGGGC 
TTCGGCGACC GGCGCAAGGC CATTCTGGAG GATATCGCGA TCCTGACGGG TGGCGAGGTC 
ATCAGCGAGG ATCTGGGCAT CAAGCTGGAA AGCGTGACGC TGTCGCAGCT TGGCCAGGCG 
CGGCGCATCG TGATCGACAA GGACAACACG ACCATCGTCG ACGGCGAGGG CGACGCCGAC 
GCCATCAAGG GCCGCGTCGG GCAGATCCGC GCGCAGATCG AGGAAACCAC CTCGGACTAC 
GATCGGGAAA AATTGCAGGA GCGCCTGGCG AAGCTGGCGG GCGGAGTGGC CATCATCCGG 
GTCGGCGGTT CGACCGAAAT CGAGGTGAAG GAGCGCAAGG ATCGCGTCGA TGACGCGCTG 
AACGCCACGC GCGCGGCCGT CGAGGAAGGC ATCGTCCCGG GCGGCGGGAC CGCGCTGGCG 
CGCGCGGCGG AGGTCGTGGC GCGGCTGCAG TTCCATAATG ACGACCAGCG CATCGGCGGC 
GACATCGTCC GCAAGGCATT GCAGGCGCCG CTGCGCCAGA TCGCGGAGAA TGCCGGCGAG 
GACGGTGCGG TCGTGGCCGG AAAGGTGCTG GAGAACGGCG CATACAATTT CGGATTCGAT 
GCGCAGATCG GCGAATTCAA GGATCTGGTC GCCGCCGGCA TCATCGACCC GACCAAGGTC 
GTGCGCACGG CCCTGCAGGA CGCGGCCTCG GTCGGCAGCC TGCTGATCAC GACCGAGGTC 
CTGGTCACCG AAAAGGCCGA ACCCAAGCCG GCCGCCCCAC CGGCGGGTGC CGACCTCGGA 
TACTGA

Protein sequence

MASKDVKFAG DARARLLSGI DTLADAVKVT LGPKGRNVVI DKSFGAPRIT KDGVTVAKEI 
ELSDKFENLG AQLLREVASK TNDLAGDGTT TATVLAQSIV REGLKAVAAG FNPQDVKRGI 
DHATTAVIEE LRTRTRPIAT REETAQVATI SANGEVEIGR IISEAVQKVG KDGVITVEEA 
KGFETELDVV EGLQFDRGYI SPYFVTNSEK LIADLENPYI LIHEKKLSSL QPLLPLLENV 
VKSGRPLLSI AEDVEGEALA TLVVNKLRGG LKIAAVKAPG FGDRRKAILE DIAILTGGEV 
ISEDLGIKLE SVTLSQLGQA RRIVIDKDNT TIVDGEGDAD AIKGRVGQIR AQIEETTSDY 
DREKLQERLA KLAGGVAIIR VGGSTEIEVK ERKDRVDDAL NATRAAVEEG IVPGGGTALA 
RAAEVVARLQ FHNDDQRIGG DIVRKALQAP LRQIAENAGE DGAVVAGKVL ENGAYNFGFD 
AQIGEFKDLV AAGIIDPTKV VRTALQDAAS VGSLLITTEV LVTEKAEPKP AAPPAGADLG 
Y