Gene Dtox_0044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0044
Symbol
ID	8426966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	45177
End bp	46634
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	45%
IMG OID	645032439
Product	transposase, IS605 OrfB family
Protein accession	YP_003189630
Protein GI	258513408
COG category
COG ID
TIGRFAM ID	[TIGR01765] transposase, putative, N-terminal domain [TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0131962
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGACAA CGGCGATGGG GATAATCCCG GAACCGACAC CTAAACAGAA AGAATACATT 
GATAACCTCA TGGATCGTTA CTGTGCCGCA GTTCGTTGGG CATTTAAAAG ACTGCTGGAC 
GGATGGAAAG TACAGGACAT TCGTATAACT GTACAAGGAA AGTTCAGACT TAACTCCCGG 
CAGGCTAACG ATGCAGTATA TGATGCCCAG ACCACAATCA AAAGCCAATA TGAATTAGTG 
CAGATGCACT ATGAAAACGC CAAAGCAAAG GTTGAATTTA CAGAAAAGCG TATCGCCAAG 
GCTAAATCAC CGGCTAAGAT TGCCAAACTG CAAAAACGGT TAGAAAAGGA ACAGCGTAAA 
CTGGCCTTCT GGCAAAATCA CCTGGATAAC AATACTTTTC CGCCTGTTGT ATTCGGAGGA 
AAGAAGCTCT TTCAAGAACG CTGCAAAGGC AATATTACCA GAGAAGAGTG GCAGGAAGTC 
AGAAGTAACC GTTATCTGTC ACGGGGAGAT AAAACCAAAG GCGGCAACCT AAATACCCGC 
ATATACGAAG GCCAAGACCA AATCTATCTT GATATAGCCG CCGACCCGGT ACGGAAAGGG 
AAATCCGTTC GGTATAACCG CATAACGGTG CCGATCTATT TAGCTCAAAA GCCATCGAAA 
AAGACCAACA AAATTAACGG TATCAACTAC CGGCAAATGG TTTTGGATTA TCTTAAAACA 
GGCAGTGCCT ATCAGGTAGA AATCCTCCGC AGAGACGGTA AATATTACGT CCATGTGAGT 
ATTGAAGAAG AAGTTCCGAT GCCATATAAT CATAAGGGCG CGTTTGGTGT AGACACCAAC 
CCGGACGGAT TAGGCGTAAC CCAGGTAGAC TGTCTGGGGC AATACCGGGG CAGTGAATGG 
CTTGGTCAAG GTGAATGGAC TTATGCCAGA ACAAACCGGA GAAATAACCA GACCTGCGAA 
ATGGCTAAGA AAGTGATCCT CCAGGCTAAA GAAAAAGGTT ATGCCCTGGC GGTAGAGGAC 
TTGAAGTTTA AAAATGACAA GTCCGTAACG GCCAAGTTTA ACCGAATGAG TCACAGTTTT 
GTCTGGTCGA AGTTTCTAAA AGCAGTTGAC CGGAGTGCTG CCCGTGAGGG AGTGCCGATA 
TTAAAGGTAA AACCGGCTTT TACTTCAGTC ATAGGCATCC TAAAATACCA GCACATGTAC 
GGCATAGCTG TTCACGAAGC GGCAGGCTAT GTCATAGCCC GGCGTGGCTT GGGCTTTGAT 
CATGAGAAGA TACCCAAGAT ATTGCTTGAT AAACTGATTA AAAAGAAACC TGAATTTAAA 
CAAATGGCAA ATTGGAAACA ATGGTCAGCA GTTAAAAAGT CTGTGCTGGC CAAGATTAAA 
AAAATCACGA AAAGGAAGAA GGTGAATAGC CTGGTTTCAT GGCAGATTCA CCGGAAAAAT 
GTGTTAGGTA TAGGTTAA

Protein sequence

MKTTAMGIIP EPTPKQKEYI DNLMDRYCAA VRWAFKRLLD GWKVQDIRIT VQGKFRLNSR 
QANDAVYDAQ TTIKSQYELV QMHYENAKAK VEFTEKRIAK AKSPAKIAKL QKRLEKEQRK 
LAFWQNHLDN NTFPPVVFGG KKLFQERCKG NITREEWQEV RSNRYLSRGD KTKGGNLNTR 
IYEGQDQIYL DIAADPVRKG KSVRYNRITV PIYLAQKPSK KTNKINGINY RQMVLDYLKT 
GSAYQVEILR RDGKYYVHVS IEEEVPMPYN HKGAFGVDTN PDGLGVTQVD CLGQYRGSEW 
LGQGEWTYAR TNRRNNQTCE MAKKVILQAK EKGYALAVED LKFKNDKSVT AKFNRMSHSF 
VWSKFLKAVD RSAAREGVPI LKVKPAFTSV IGILKYQHMY GIAVHEAAGY VIARRGLGFD 
HEKIPKILLD KLIKKKPEFK QMANWKQWSA VKKSVLAKIK KITKRKKVNS LVSWQIHRKN 
VLGIG