Gene Dtox_3957 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3957
Symbol
ID	8430972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	4140430
End bp	4142454
Gene Length	2025 bp
Protein Length	674 aa
Translation table	11
GC content	49%
IMG OID	645036175
Product	excinuclease ABC subunit B
Protein accession	YP_003193273
Protein GI	258517051
COG category	[L] Replication, recombination and repair
COG ID	[COG0556] Helicase subunit of the DNA excision repair complex
TIGRFAM ID	[TIGR00631] excinuclease ABC, B subunit

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000186158
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.0000000163265
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGATTTAA AAATAAGATC CGAATTTACA CCCAGGGGAG ACCAACCTCA GGCTATTGCT 
CAGTTGGTAG ACGGGTTGGG TAAAAAATAT GATAAACAGA TACTTTTAGG AGTTACCGGC 
AGCGGCAAGA CTTATACCAT GGCTAAAGTA ATAGAAGAAG TGCAAAGGCC TGCCCTGATT 
CTGGCACCCA ATAAGACACT GGCAGCCCAG CTTTGCTCCG AGTTCAAAGA GTTCTTTCCC 
AACAATGCAG TTGAATATTT CGTCAGTTAT TATGACTACT ACCAGCCGGA GGCTTATATA 
GCCCATACCG ATACCTATAT AGAAAAGGAT TCTTCCCTCA ATGATGAGAT AGACAAACTG 
CGCCACTCTG CCACCTGTGC ACTGTTTGAG CGGCGGGATG TAGTCATTGT AGCCAGTGTT 
TCCTGTATTT ACGGCCTGGG TGACCCGGAG GAATACAGCA CGCTGGTGCT TTCTCTGCGG 
CAGGGAGTGG AATATGACAG GGATGCCATA CTGCGCAAGC TGGTGGATAT CCAGTATGAG 
CGCAATGACA TAAACTTTAC CCGCGGCACT TTTCGCGTGC GGGGCGATGT CATAGAAATT 
TTTCCGGTAG CTGCCACTGA GCAGGCTATC AGAGTGGAGA TGTTTGGGGA TGAGGTGGAA 
AAACTTTTGC AGTTTGACGT TCTGACCGGT GAGATAACCG GGCAGCGCCA GCATATTTCT 
GTCTTTCCGG CCAGCCACTA CGCCACCTCC AAGGAGAAAA TGGAGGAGGC CATCAGCCGT 
ATTGAGTCAG AGCTGGAGCA AAGGTTGGCC GAGCTGCGAA AACAGGATAA GCTGCTGGAA 
GCGCAGCGCC TTGAGCAGAG AACTAACTAT GATATTGAGA TGATGAGGGA GATGGGCTTT 
TGCAACGGGA TTGAGAACTA TTCCCGACAC CTGACCGGCA GGGAGGCGGG CCAGCCCCCC 
TATACTTTGT TGGATTATTT TCCTGATGAT TTCATTATGT TTATAGATGA GTCGCATGTG 
GCTGTGCCAC AAATTGGCGG CATGTACGAG GGGGACAGGT CGCGGAAAGC CTCGTTGATT 
GAACACGGTT TTCGCCTGCC TTCCGCACTG GATAACCGTC CCCTGCAGTT TAATGAGTTT 
GAGGAGAGAG TTAAACAGGT TATATATGTT TCAGCAACTC CCGGTGCTTA TGAATTAAAA 
CATCACAGGC AAATTGTGGA ACAGGTAATT CGCCCCACCG GTTTGGTTGA CCCGGAAATT 
ATCATTCGCC CGACCAGAGG ACAGATTGAT GATCTGCTGA TGGAAATCCG ACTGAGAGAA 
AAACGTGATG AGAGAGTTCT TATAACTACC CTGACCAAGA AAATGGCCGA GGATTTAACT 
GATTACTTCA AAGAAAACGG GGTAAAAGTG CGTTACCTGC ATTCCGACAT CAATACGCTG 
GAGCGGATGG AGATACTGCG TGATTTGCGT TTGGGTGTTT TTGACGTGCT GGTGGGAATT 
AACCTCTTGC GCGAAGGCCT GGATTTGCCT GAAGTAAGCC TGGTGGCTAT ACTGGACGCG 
GATAAGGAAG GCTTCCTGCG CTCCGAGCGT TCACTGATCC AGACTACAGG CCGGGCGGCC 
CGTAATGTGG AGGGTAAGGT GATTATGTAT GCGGACAGGA TTACTGAATC TATGTCCAAA 
GCGATCAATG AGACTGAACG CCGCCGCAAA AAGCAGCTGG ACTTCAACGA AAAATACAAT 
ATTACGCCGC AAACAGTGCG CAAGGCGGTG CGCGATGTAT TGGAAGCTAC TAAGGTGGCT 
GAAAGCAAGG TGCCTTATGC TGTCTCCGGT AAGGCGAAGA TGTCCAAAAA GGATTTAATA 
AAAATGATTG CCGGGATGGA AAAAGAGATG AAAGAGGCAG CCAGGCAGTT GGAATTCGAG 
CAGGCAGCCA GATTAAGGGA TACTATTATC GAACTGCGGC TAAAATTACG CGGTGAGAAA 
AACATTAAAG CAGCCATACC CGACGACGGG GAGATAGCTT ATTAA

Protein sequence

MDLKIRSEFT PRGDQPQAIA QLVDGLGKKY DKQILLGVTG SGKTYTMAKV IEEVQRPALI 
LAPNKTLAAQ LCSEFKEFFP NNAVEYFVSY YDYYQPEAYI AHTDTYIEKD SSLNDEIDKL 
RHSATCALFE RRDVVIVASV SCIYGLGDPE EYSTLVLSLR QGVEYDRDAI LRKLVDIQYE 
RNDINFTRGT FRVRGDVIEI FPVAATEQAI RVEMFGDEVE KLLQFDVLTG EITGQRQHIS 
VFPASHYATS KEKMEEAISR IESELEQRLA ELRKQDKLLE AQRLEQRTNY DIEMMREMGF 
CNGIENYSRH LTGREAGQPP YTLLDYFPDD FIMFIDESHV AVPQIGGMYE GDRSRKASLI 
EHGFRLPSAL DNRPLQFNEF EERVKQVIYV SATPGAYELK HHRQIVEQVI RPTGLVDPEI 
IIRPTRGQID DLLMEIRLRE KRDERVLITT LTKKMAEDLT DYFKENGVKV RYLHSDINTL 
ERMEILRDLR LGVFDVLVGI NLLREGLDLP EVSLVAILDA DKEGFLRSER SLIQTTGRAA 
RNVEGKVIMY ADRITESMSK AINETERRRK KQLDFNEKYN ITPQTVRKAV RDVLEATKVA 
ESKVPYAVSG KAKMSKKDLI KMIAGMEKEM KEAARQLEFE QAARLRDTII ELRLKLRGEK 
NIKAAIPDDG EIAY