Gene Dtox_4090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_4090
Symbol
ID	8431104
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	4258034
End bp	4259358
Gene Length	1325 bp
Protein Length	441 aa
Translation table	11
GC content	35%
IMG OID	645036288
Product	transposase IS204/IS1001/IS1096/IS1165 family protein
Protein accession	YP_003193386
Protein GI	258517164
COG category	[L] Replication, recombination and repair
COG ID	[COG3464] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCTC GCTTGGAAGA CTTTATCATC ACGCTTGCAC TTAATACGAG TTGTGAAGGT 
ACTGCCCGTA TTTGTAAACA GATGAATATC AATATTAGCG GTGATACTGT AATTAAGATC 
CTGTTACGCA ATGCCAAATC CATCGATCCT GAGTACGGTG AATTTATAGG TGTTGATGAT 
TGGGCCTATA AAAAGGGACA TACCTACGGG ACCATTATAT GTGATGGTGC TTCCCATAAA 
CCAATTGCCC TCTTAGATGG TCGCGACGGA AGTGCCTTAA AAGAATGGCT AGAGAGAAAT 
CAACACATTA AAACAGCTAC GAGAGATAGA GCCAGTAGTT ATGCAAAAGC CATTGAGGAA 
GCACTGCCAC AGGCGATGCA GATTGCCGAC AGATTCCACC TTCACCAAAA TCTTTTAAAA 
GCGATCAAAG ACGCACTGGG ACGAGAAATT CCAGCAAAAA TAATGATTCC TATAGCGAAT 
TCAGCTCCTA ATTTAGCTGA CTCACCAGCT ATGGACGAGC CTAAATTAAA AAAAATGTGT 
TAACTGATGC TGAGAAAAAT CGAAGAGAAA CGATTATTAA GATTCAATCT TACTTATCTC 
AAGGTTATTC AAGTAAAGCC ATTTGTGAGA TGATGCACAC AACTTATAGG CAAATTAGGA 
AGTTTTCAAT AGGTGATCCC GATATTCTAT GCTGCAGTAA TAAATTGAAG TCAAATTCCT 
TATGTAGATC CGAGCTTGAT CAATATAAAA ACATCATTTT GGAACAATTA GCTTTAAAGG 
CAAAAATCAA AAGTATCTAT GAATTAATCC TTGAGAGAGG ACATACCGGA AAACGCACTA 
ACTTTTATGA TTATTGCAAA AAACTTATAG AGAAAAATGA TGTTGCTCAC CCTACAAACA 
CCAATATTCT TGATGTCAAA CTTAATAAGA ACAAACCCAA AGGCCATTTC ATTGAAAGAA 
ATCGAATATT AAAATACCTT TGGTCTAACT TGAATATTCC ATTGGCAGAT ATTGATTTCA 
TTTTAGAGAG GTATCCATTC TTAAAAGAAA TGGGAGATTG TATTTCAGAC TTTCGAAATA 
TTTATGTCAA CAAGAGCGTT ACACTCTTAA AAGAGTTTGT AGATAAATAT GTTAAAAGCA 
ATAACAAGAA CCTGAAGTCA TTTGCAAATG GTATTTTTAA AGACTTTATA GCTGTTAAAA 
ATTCAGTTAT CAGTGAATAC AGTAATGGAT TTATTGAAGG TAATAACAAT CGTCTAAAAA 
TGATCAAACG CACCATGTAT GGAAGAGCCG GTTTAAATCT TCTCAGAGCT AAGATTATCT 
ATTAG

Protein sequence

MTSRLEDFII TLALNTSCEG TARICKQMNI NISGDTVIKI LLRNAKSIDP EYGEFIGVDD 
WAYKKGHTYG TIICDGASHK PIALLDGRDG SALKEWLERN QHIKTATRDR ASSYAKAIEE 
ALPQAMQIAD RFHLHQNLLK AIKDALGREI PAKIMIPIAN SAPNLADSPA MDEPKLKKNV 
LTDAEKNRRE TIIKIQSYLS QGYSSKAICE MMHTTYRQIR KFSIGDPDIL CCSNKLKSNS 
LCRSELDQYK NIILEQLALK AKIKSIYELI LERGHTGKRT NFYDYCKKLI EKNDVAHPTN 
TNILDVKLNK NKPKGHFIER NRILKYLWSN LNIPLADIDF ILERYPFLKE MGDCISDFRN 
IYVNKSVTLL KEFVDKYVKS NNKNLKSFAN GIFKDFIAVK NSVISEYSNG FIEGNNNRLK 
MIKRTMYGRA GLNLLRAKII Y