Gene Dtox_4350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_4350
Symbol
ID	8431369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	4527864
End bp	4529816
Gene Length	1953 bp
Protein Length	650 aa
Translation table	11
GC content	40%
IMG OID	645036543
Product	Sigma 54 interacting domain protein
Protein accession	YP_003193636
Protein GI	258517414
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1067] Predicted ATP-dependent protease
TIGRFAM ID	[TIGR00764] lon-related putative ATP-dependent protease [TIGR02903] ATP-dependent protease, Lon family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCTT TTCTGGAAAA ATTTATGGGT GCCGCAAAGG CTGACAAATT TGAAGACAAG 
CCTGGCATTA ATGAACAATT AAAATACAGG GTTAACGCTT TATATGATTT GATAGCTAAT 
ATTTACGGTT CTGATAAACT GGTATTGAGA GCCGGAAAAC TGGACGCTCT TAAACTGATG 
CGTTCTGAGA TACTTTCAAA AAGAGTTTTA GCTTTGCAAA AAATTATATT TGAGGATGCT 
GTGACAGATA TTGAACCAGA TCATGAAGAA ATACCAATAA TTTTAGATAA AATAGAAGAT 
AAGATATCCG ATTATTTAGC CAGAAGATCA TTGGAAGATG AACTGGAAAG AAAAATCAAG 
GAAAAGATGA ATGAAAGACA GGAGGATTAT TTGCAAGAAA TTAAAATGCA GGTAATTAAG 
GAAAATACGG GTCCGGAAAA CGCTCAGACC CTTAAGAAGC TTGCTGTTTT GGAAAAGCTG 
GAGCATAAAA AATTATCAAG CACGGCCATG GAGTTTTTGC GGCCAACCTG CTTTGGCGAA 
ATTATCGGGC AGGAAAGGGC TGTCAAAGCC CTGCTGTCTA AACTTGCTTC ACCCTTTCCC 
CAGCATATAC TATTATACGG GCCTCCCGGT GTAGGTAAAA CAACTGCTGC CCGCTTGGCC 
TTGGAGGCAG CTAAAAATAT CAGTGGCACT CCTTTTGTTA AAGATGCTCC TTTTATTGAG 
GTTAACGGTA CAACGCTGCG CTGGGATTCC AGGGAAATTA CCAACCCTCT GCTGGGTTCT 
GTTCATGACC CGATTTATCA GGGAGCACGC CGTGATTTGG CTGATTCAGG AATACCTGAG 
CCGAAATTGG GTTTGGTCAC GGACGCTCAC GGGGGCATAC TTTTTATTGA TGAGATAGGT 
GAGATGGACC CGATATTGCA GAATAAATTA TTAAAAGTGC TTGAGGATAA GAGAGTATTT 
TTTGAATCCA CTTATTATGA TCCGGGTGAC CAGAGTATAC CCCGGTATAT TAAAAAATTA 
TTTGATCAAG GAGCACCGGC AGATTTTTTA CTGATCGGAG CTACAACAAG AAGTCCGGAG 
GATATTAACC CGGCTATCAG ATCGCGCTGT GCAGAGGTTT ATTTTGATCC TTTAACTCCA 
GGAGCTATTA AACAGATAGT AAATCAGGCG GCAGATAAAC TTAATATTGG ACTGGAAGAT 
AAGGTTGCGG AAATAATTAG CGAATATACT ATTGAAGGGC GTAAAGCAGT TAATATTCTG 
GCTGATGCCT ATGGGATGTC ATCTTATAGA AATGAAGAGA CTGCTTATGA GCAAAAAAAA 
TTATATATTT GTGAGCTTGA TATTTACGAT GTTGTGCAGA CCAGCCGTCT TACTCCCTAT 
GTGTTGTATA AAGCTTCTTC ACGAAAAGAA ACAGGTAAAA TCTTTGGCCT GGGTGTTACA 
GGTTTTATTG GGTCCGTGTT GGAAATTGAG GCCATTACGT TTTCTGCCAG ACAACCGCAG 
AGAGGTAATA TACGCTTTAA TGATACTGCC GGCAGTATGG CCAAAGATTC GGTATTTAAT 
GCTGCTTCAG TAATTCGCAA GTTAACCGGG GAAGATTTGA ACAATTACGA TGTGCATATT 
AATATTATTG GCGGAGGGCG TATTGATGGT CCTTCTGCCG GAGTAGCCAT GCTGCTGGCA 
GTCTTAAGCA CTATAAAGGA TTATCCTATT CCTCAGGATA TTGCTGTTAC CGGTGAGGTG 
TCCATTCAAG GAAAGATAAG AGCTGTGGGG GGTATAGCGG AAAAAATATA TGGTGCCAGG 
CAAGCCGGTA TAAAAACAGT TTTTATCCCG GCTGAGAATT TTTCTGATAT ACCGAGAGAT 
ATAAAAAATA TTAAAATAAT TCCTGTAAGC TCTGTAGAAG AAATAATAGA TTATATTTTC 
CCTAATACAA AATTTAATCA ATCAGTAAGT TAA

Protein sequence

MKAFLEKFMG AAKADKFEDK PGINEQLKYR VNALYDLIAN IYGSDKLVLR AGKLDALKLM 
RSEILSKRVL ALQKIIFEDA VTDIEPDHEE IPIILDKIED KISDYLARRS LEDELERKIK 
EKMNERQEDY LQEIKMQVIK ENTGPENAQT LKKLAVLEKL EHKKLSSTAM EFLRPTCFGE 
IIGQERAVKA LLSKLASPFP QHILLYGPPG VGKTTAARLA LEAAKNISGT PFVKDAPFIE 
VNGTTLRWDS REITNPLLGS VHDPIYQGAR RDLADSGIPE PKLGLVTDAH GGILFIDEIG 
EMDPILQNKL LKVLEDKRVF FESTYYDPGD QSIPRYIKKL FDQGAPADFL LIGATTRSPE 
DINPAIRSRC AEVYFDPLTP GAIKQIVNQA ADKLNIGLED KVAEIISEYT IEGRKAVNIL 
ADAYGMSSYR NEETAYEQKK LYICELDIYD VVQTSRLTPY VLYKASSRKE TGKIFGLGVT 
GFIGSVLEIE AITFSARQPQ RGNIRFNDTA GSMAKDSVFN AASVIRKLTG EDLNNYDVHI 
NIIGGGRIDG PSAGVAMLLA VLSTIKDYPI PQDIAVTGEV SIQGKIRAVG GIAEKIYGAR 
QAGIKTVFIP AENFSDIPRD IKNIKIIPVS SVEEIIDYIF PNTKFNQSVS