Gene Dtox_1106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_1106
Symbol
ID	8428045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	1131143
End bp	1132600
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	44%
IMG OID	645033441
Product	transposase, IS605 OrfB family
Protein accession	YP_003190615
Protein GI	258514393
COG category
COG ID
TIGRFAM ID	[TIGR01765] transposase, putative, N-terminal domain [TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000302235
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGACAA CGGCGATGGG AATAATCCTG GAACTGACAG CTAAACAGAA AGAATACATT 
GATAACCTCA TGGATAATTA CTGTGCCGCA GTTCGTTGGG CATTTAAAAG ACTGCTGGAC 
GGATGGAAAG TACAGGACAT TCGTATAACT GTACAAGAAA AGTTCAGACT TAACTCCCGG 
CAGGCTAACG ATGCAGTATA TGATGCCCAG ACCATAATCA AAAGCCAATA TAAATTAGTG 
CAGATGCACT ATGAAAACGC CAAAGCAAAG GTTGAATTTA CAGAAAAACG TATCGCCAAG 
GCTAAATCAC CGGCTAAGAT TGCCAAACTG CAAAAACGGT TAGAAAAGGA ACAGCGTAAA 
CTGGCCTTCT GGCAAAATCA CCTGGATAAC AATACTTTTC CGCCTGTTGT ATTCGGAGGA 
AAGAAGCTCT TTCAAGAACG CTGCAAAGGT AATATTACCA GAGAAGAGTG GCAGGAAGTC 
AGAAGTAACC GTTATCTGTC ACGGGGAGAT AAAACCAAAG GCGGCAACCT AAATACCCGC 
ATATACGAAG ACCAAGACCA AATCCATCTT GATATAGCTG CCGACCCGGT ACAGAAAGGG 
AAATCCGTTC GCTATAACCG CATAACGGTG CCGATTTATT TAGCTCAAAA GCCATCGAAA 
AAGACCGGCA AGATTAACGG TATCAACTAC CGGCAAACGG TTTTGGATTA TCTTAAAACA 
GGCAGTGCCT ATCAGGTAGA AATCCTCCGC AGAGACGGGA AATATTACGT CCATGTGAGT 
ATTGAAGAAG AAGTTCCGAT GCCATATAAT CATAAGGGTG CATTTGGCAT AGACGCCAAT 
CCGGACGGAT TAGGCGTAAC CCAGGTAGAC TGTCTGGGGC AATACCGGGG CAGTGAATGG 
CTTGGCCAAG GCGAATGGAC TTATGCCAGA ACAAACCGGA GAAATAACCA GACCTGCGAA 
ATGGCTAAGA AAGTGATCCT CCGGGCTAAA GAAAAAGGTT ACGCCCTGGC GGTAGAGGAC 
TTGAAGTTTA AAAATGACAA GTCCGTAACG GCCAAGTTTA ACCGAATGAG TCACAGTTTT 
GTCTGGTCGA AGTTTCTAAA AGCAGTTGAC CGGTGTGCTG CCCGTGAGGG AGTGCCGATA 
TTAAAGGTAA AACCGGCTTT TACTTCGGTC ATAGGCATCC TAAAATACCA GCACATGTAC 
GGCATAGCTG TTCACGAAGC GGCAGGCTAT GTCATAGCCC GGCGTGGCTT GGGCTTTGAT 
CATGAGAAGA TACCCAAGGT GTTGCTTGAT AAACTGGTTA AAAAGAAACC TGAATTTAAA 
CAAATGACAA ATTGGAAACA ATGGTCAGCA GTTAAAAAGT CTGTGCTGGC CAAGATTAAA 
AAAATCACGA AAAGGAAGAA GGTGAATAGC CTGGTTTCAT GGCAGATTCA CCGGAAAAAT 
GTGTTAGGTA TAGGTTAA

Protein sequence

MKTTAMGIIL ELTAKQKEYI DNLMDNYCAA VRWAFKRLLD GWKVQDIRIT VQEKFRLNSR 
QANDAVYDAQ TIIKSQYKLV QMHYENAKAK VEFTEKRIAK AKSPAKIAKL QKRLEKEQRK 
LAFWQNHLDN NTFPPVVFGG KKLFQERCKG NITREEWQEV RSNRYLSRGD KTKGGNLNTR 
IYEDQDQIHL DIAADPVQKG KSVRYNRITV PIYLAQKPSK KTGKINGINY RQTVLDYLKT 
GSAYQVEILR RDGKYYVHVS IEEEVPMPYN HKGAFGIDAN PDGLGVTQVD CLGQYRGSEW 
LGQGEWTYAR TNRRNNQTCE MAKKVILRAK EKGYALAVED LKFKNDKSVT AKFNRMSHSF 
VWSKFLKAVD RCAAREGVPI LKVKPAFTSV IGILKYQHMY GIAVHEAAGY VIARRGLGFD 
HEKIPKVLLD KLVKKKPEFK QMTNWKQWSA VKKSVLAKIK KITKRKKVNS LVSWQIHRKN 
VLGIG