Gene Dtox_1823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_1823
Symbol
ID	8428801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	1931782
End bp	1933542
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	39%
IMG OID	645034161
Product	Transposase-like protein
Protein accession	YP_003191296
Protein GI	258515074
COG category	[L] Replication, recombination and repair
COG ID	[COG5421] Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.615645
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCTCA AGAAATCCGT TAAGACAGTC AAAGGGAAAA AATACTCCCA TTATAGTATA 
GTCGAATCAT TTAGAGACAA CGGTAAAGTT AAACACCGCT TAATTTTTGC AATTGGCCCT 
CTTGATGATG AAGCAGCCGA TCGGTTACGC TTAACGCTTA ATGCCCACTC TAACCAAGAT 
CTTGTTGTGG CCAAATCTGA TGATATTGTT GTCACAAAGC ATGGAGCATA TTTAGATGTA 
GCTGTTCTGG TTCATATCTG GCAACAATGG CAGTTTCACG AGTTCTTTCA GGATGACCGC 
TGGGTTACAG GTATGGTAAT TAACCGTTGT ATTGACCCGG TTGCGAAATG CAATGTGCAG 
GAGTGGATGA CCAAAACAGT ACTGCCTGCC TATATAGATA CAGATCCATT GTCAATGAAT 
GCATTTGATA TCTTTCGAGA ACTAGACCGA CTATGCCAGC GAGAAACCGA GCTACAGTCA 
TATATGTTTC GTAAAATTCA AGAAAAGCGA CCAAATAGCC TGGATGTGTT TTTTTATGAT 
ATTACCTCTA CATATGTAAC AGGAAGTCGC TGCGTACTTA CTAAGTTTGG CTACTCGCGG 
GATCACCGTC CCGATTGCGA ACAAATTGTT ATTGCTTTGA TGATTACCCC GGATGGTTAC 
CCTTTTTATT GGAAGTTGCT GGAGGGTAAT ACTCAGGATG TTTCCACAGT TTGCGACTTA 
ATCCAAAACG TCAAGACTTG TTTTCCCATA CAACACTGCA CCATGGTTTT TGACCGAGGT 
ATGGTATCTG CTGATAACCT TAAAACATTA GAGAAAACAA ATTGGGATTA TGTTTCGGCA 
ATGGACAGGG ACGAGATTAA CGTATTATCA TTTTTCGAAA CAGCATTGCC AACCCCTCCT 
ATGCCGGAGG ACTGGGAACA AGTCTTGGCG ATGCAGGAAT TTCAACCAAT AGATGATGAC 
ATATTGTATT ACCGAGAATT TGAAGATGAT AATCGGCGAT ACATTATAAC TTTTGACGTG 
GCACGTTTTC TTGATGAGCA CCAAATACAA AGAAATAAGG TAGAACAAAT TAATAGGTGG 
CTAATCAAAA AAAATGGGGA TTTGAAACAA GCCAAAAAAT CAAGAAATCG TGACACTCTT 
GAGCGAGAAA TCAGCAAAAT CTCGAAACGG TTTCATGTTC ATAAATATTT GTCCGTTCAG 
ATTACGCCCT GTTCTCGTAC CGTTACAACT AAAACTGGTA AATCTCGTAC TGTTGAATCA 
TTTCAGCTTT CAGATACTAT TGACAACACT GCTTTGCAGA AAGAACAACG TTTGTATGGA 
ATCACATGTT TTATCTCCAA TATTACCCAA GAGCGTATAT CTGCTCAGGA AATAGTACAG 
TGGTATCGAC GGAAAAATAA AATTGAAGAA GCCTTTAGGG AGATAAAATC ACATCTTGAA 
TTACGTCCAA TTTATTTAAC CAGGGAGAAA AGAGTAAGGG CCCATGTTGC TGTTTGCATG 
CTAGCCTATT TTCTGAGAAA TGATATTGAG CTCCAACTTA AGGAGCACGG AATTTCCAAT 
TCAACTGAGA CGGTTTTAGC CTTATTAGCT GAGTGCAAGG CTAATCGCTG GGTCTTTGAT 
AAATCGGAGG CAAAGACACA CTTAAATATC ACAAAGGTCT CCGAAAAGCA ACAACAAATA 
TTAAAAGCGC TTGGATGTGA ATCAATTGTG GACGTAAAGC ATGTTAAAAA CATTTTACAA 
AAGGCCGAAA ATTGGCTGTA G

Protein sequence

MFLKKSVKTV KGKKYSHYSI VESFRDNGKV KHRLIFAIGP LDDEAADRLR LTLNAHSNQD 
LVVAKSDDIV VTKHGAYLDV AVLVHIWQQW QFHEFFQDDR WVTGMVINRC IDPVAKCNVQ 
EWMTKTVLPA YIDTDPLSMN AFDIFRELDR LCQRETELQS YMFRKIQEKR PNSLDVFFYD 
ITSTYVTGSR CVLTKFGYSR DHRPDCEQIV IALMITPDGY PFYWKLLEGN TQDVSTVCDL 
IQNVKTCFPI QHCTMVFDRG MVSADNLKTL EKTNWDYVSA MDRDEINVLS FFETALPTPP 
MPEDWEQVLA MQEFQPIDDD ILYYREFEDD NRRYIITFDV ARFLDEHQIQ RNKVEQINRW 
LIKKNGDLKQ AKKSRNRDTL EREISKISKR FHVHKYLSVQ ITPCSRTVTT KTGKSRTVES 
FQLSDTIDNT ALQKEQRLYG ITCFISNITQ ERISAQEIVQ WYRRKNKIEE AFREIKSHLE 
LRPIYLTREK RVRAHVAVCM LAYFLRNDIE LQLKEHGISN STETVLALLA ECKANRWVFD 
KSEAKTHLNI TKVSEKQQQI LKALGCESIV DVKHVKNILQ KAENWL