Gene Dtox_0834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0834
Symbol
ID	8427773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	853007
End bp	854329
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	47%
IMG OID	645033189
Product	transposase, IS605 OrfB family
Protein accession	YP_003190363
Protein GI	258514141
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00917857
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGCAA CCCAAAAGAA CCGTATTAAA CATCTAACTA AAGAGCAATA TGCTCTACTG 
CAAAACCTCT GCCGGTATGC CAAAAACCTG TACAATGTGG CATTGTACAA CATACGGCAG 
CACTACTTTG TCACCGGCAA GCTTCTAAGC TACGCCAAAA ACTGTGCCCT GTGCAAAACC 
AACGAAAACT TTAAGATGCT GCAGGCCGGT GTTTCCCAGC AGATTATCCG GGTAGCTACC 
CAAAGTTTCA AAAGCTTTCT CGGATTGAAA AGGTTAGCAG CTAAAGGCCA GTACCCGGCA 
GAGAAAGTCC GTATCCCACG CTACCTGAAA AAAGACGGCT ACTTTCAACT GGTACTGTCA 
ACCAACGCAA TAACCATAAA TGCCGGGTAC CTGCAGCTGC CGTTATCAAA CGTATTCAAA 
AAAGACCACC CGGAGGCCAG GGACATCCGG TTTCCGTTTC CCGAGCGATT AGATAAAACC 
AGTATTCGGG AGGTACGCAT CAATCCGGCT CATAAGGCCC ACTTCTTTGA AGTGGAGTAT 
ATCTACCGTG ACAAGCCAGT AGTGCTGCCT TCCCTGGATA GCAATCGCAT CCTGGGCATA 
GATTTGGGTG TAGATAACCT GGCTGCCTGT GCATCCACCA CCGGGCATGT CTTATTAATT 
GACGGCAAGC AACTCAAGGC CGCCAACCAG TGGTATAACA AAGAAAGAGC CAGACTGCAG 
TCTATTAAAG ATCTGCACAA CATTAAGAGT GAAACCCACA AGCTGGCTGC CCTTGCCGTA 
TCCCGGGAAA ATTTTATCAC CGACTACTTG CGGAAAGCTG CCAAACATAT TGTAGAATTC 
AGTATCTCCC TGGAGATTGG CACCGTGGTA GTTGGTGTAA ATAAGGAACA AAAGCAGGGA 
GTCAACATTG GCCACGTTAA CAACCAGAAC TTTGTACAAA TCCCCCTCTG GAAGTTCCGG 
CGTGTTCTGA AAAACATCTG CGATAAGTAC GGTATCACCT ATATTGAGGT AGAGGAAAGC 
TACACCAGTA AAGCCAGCTT CCTTGATAAG GATTTTTTGC CGGAGTACGA TCCCGCGAAC 
AAAAATGAAT ACACCTTCAG CGGTAGACGG GTTAAGCGGG GGTTGTATCG AACAAAAAAC 
GGTTGTACTA TTCATGCCGA CATCAATGGT GCAGCGAATA TCATCCGCAA ATACCGGTTG 
GATGGGGATT TTTCTGTTCT GGATAAGGGT ATATTCTTAA ATCCCTACCG GGTACAGGTT 
CTAAATACGC CCCGTAAGAA ACCACCGGTA GTCCAGAAAA AGAAAAGTAA GGCAGCGGCG 
TAA

Protein sequence

MFATQKNRIK HLTKEQYALL QNLCRYAKNL YNVALYNIRQ HYFVTGKLLS YAKNCALCKT 
NENFKMLQAG VSQQIIRVAT QSFKSFLGLK RLAAKGQYPA EKVRIPRYLK KDGYFQLVLS 
TNAITINAGY LQLPLSNVFK KDHPEARDIR FPFPERLDKT SIREVRINPA HKAHFFEVEY 
IYRDKPVVLP SLDSNRILGI DLGVDNLAAC ASTTGHVLLI DGKQLKAANQ WYNKERARLQ 
SIKDLHNIKS ETHKLAALAV SRENFITDYL RKAAKHIVEF SISLEIGTVV VGVNKEQKQG 
VNIGHVNNQN FVQIPLWKFR RVLKNICDKY GITYIEVEES YTSKASFLDK DFLPEYDPAN 
KNEYTFSGRR VKRGLYRTKN GCTIHADING AANIIRKYRL DGDFSVLDKG IFLNPYRVQV 
LNTPRKKPPV VQKKKSKAAA