Gene Dtox_3372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3372
Symbol	groEL
ID	8430366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3579080
End bp	3580720
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	47%
IMG OID	645035606
Product	chaperonin GroEL
Protein accession	YP_003192725
Protein GI	258516503
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAC AAATTATCTT CAACGAAGAT GCCCGCAAAG CATTGGAAAA AGGAGTCAAT 
CAATTAGCCG AAGCTGTACG TGTAACCCTT GGCCCGAAAG GCCGGAATGT GGTTCTTGAT 
AAAAAATTCG GTGCGCCGAC AATTACCAAC GACGGTGTCA CCATTGCCAG AGAGATTGAA 
CTGCCGGATG TATTCGAAAA CATGGGCGCT CAGCTGGTAA AAGAAGTTGC TACCAAAACC 
AACGATGTAG CAGGTGACGG TACCACAACC GCTACGGTAC TGGCTCAAGC TATGGTTCGC 
GAAGGCTTAA GAAACGTTAC TGCCGGTGCC AACCCGATGA TTATCAAGCG TGGTATTGAG 
AAGGCTGTGG AAAAAGCAGT AGATGCTATT AAAAACAGCT CCAAGCCGAT TGAAAGCAAA 
GGTGCTATTG CCCAGGTTGC TTCAATTTCT GCTAATGATG AAACTATCGG TAATTTAATT 
GCCGACGCCA TGGAAAAAGT AGGAAAAGAC GGTGTTATCA CTGTTGAGGA ATCCAAGGGT 
ATCGGTACCA CTTTAGATGT AGTGGAAGGT ATGAATTTTG ACCGCGGCTA TATTTCTCCG 
TATATGATTA CCGATACTGA TAAAATGGAA GCAGATTTGG AGGAGCCCTA CATACTGTTG 
ACAGACAAGA AGATTTCCTC CATTCAGGAA ATTCTGCCCA TTTTGGAAAA AGTGGTTCAG 
TCCGGCAAAG CGCTTTTGAT CATTGCAGAA GATTTGGAAG GCGAAGCTCT GGCTACTCTG 
GTTCTCAATA AACTGCGCGG AACCTTCACT TGTGTAGCAG TGAAAGCTCC TGGTTTCGGT 
GATCGCCGCA AAGCCATGAT GCAGGATATA GCTATTCTAA CCGGTGCTCA GGTGATTACT 
GAAGAACTCG GCTTAAAGCT GGATAAAGCT ACTATTGATA TGCTCGGCAG AGCTTCCAGA 
GTCAGAGTTA AGAAAGAAGA AACCATCATT GTCGGCGGTT CCGGCAGTGT GGATGAAATC 
AAACAGCGTG TTAACCAAAT CAAGGCACAG ATCGAAGAAA GCACTTCCGA CTTTGACCGC 
GAGAAGCTCC AGGAGCGTTT GGCAAAGCTG GCCGGCGGCG TAGCCGTAAT CCAAGTTGGT 
GCTGCCACTG AAGTTGAAAT GAAAGAGAAG AAGCTGCGCA TTGAGGATGC TCTTAATGCT 
ACCAGGGCTG CCGTGGAAGA AGGTATCGTG TCCGGTGGCG GTGTTGCTTA TGTAAGCATT 
ATTCCTGATC TTGTAGATAT GGAAGCAGCT AATTTAGACG AGAAATCCGG TATTGATATT 
GTTCGCCGCG CTCTGGAAGA TCCCTTGCGC CAGATTGCCA ACAATGCAGG TCTTGAAGGC 
TCAGTTGTGG TGGAAAAAGT TAAGGTTTCC GAAAACGGTG TAGGTTTCAA CGCCTTGACA 
GGTGAATATG TCAATATGAT CGATGCCGGT ATTGTGGACC CGGCTAAAGT TACCCGCTCT 
GCCCTGCAGA ACGCTGCCAG CATTGCTGCT ATGATTCTGA CCACTGAAAC CCTGATAGCT 
GAGAAACCTG AAGAGGGTAA GGATGCTATG GCCGGCATGG GCGGCATGGG CGGTATGGGT 
GGCATGGGCG GCATGATGTA A

Protein sequence

MAKQIIFNED ARKALEKGVN QLAEAVRVTL GPKGRNVVLD KKFGAPTITN DGVTIAREIE 
LPDVFENMGA QLVKEVATKT NDVAGDGTTT ATVLAQAMVR EGLRNVTAGA NPMIIKRGIE 
KAVEKAVDAI KNSSKPIESK GAIAQVASIS ANDETIGNLI ADAMEKVGKD GVITVEESKG 
IGTTLDVVEG MNFDRGYISP YMITDTDKME ADLEEPYILL TDKKISSIQE ILPILEKVVQ 
SGKALLIIAE DLEGEALATL VLNKLRGTFT CVAVKAPGFG DRRKAMMQDI AILTGAQVIT 
EELGLKLDKA TIDMLGRASR VRVKKEETII VGGSGSVDEI KQRVNQIKAQ IEESTSDFDR 
EKLQERLAKL AGGVAVIQVG AATEVEMKEK KLRIEDALNA TRAAVEEGIV SGGGVAYVSI 
IPDLVDMEAA NLDEKSGIDI VRRALEDPLR QIANNAGLEG SVVVEKVKVS ENGVGFNALT 
GEYVNMIDAG IVDPAKVTRS ALQNAASIAA MILTTETLIA EKPEEGKDAM AGMGGMGGMG 
GMGGMM