Gene Dtox_3421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3421
Symbol
ID	8430415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3621136
End bp	3622368
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	46%
IMG OID	645035648
Product	transposase, IS605 OrfB family
Protein accession	YP_003192767
Protein GI	258516545
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTAAAT GTAAAAATAA CCAATCAAAG AAGTCAAAGT CAAAAGGCAT CGACATTTTG 
GTGAATAAAT TTCCTGTATA CCTAACCCCG GAGCAAACTT TCCTGGCCCG TACCCTGCAA 
AGAGAGGCAG CCAAAGTATG GAACACAACT TGCACTGTTC ACCGTACAAT CTATATAAAA 
CATCACTGCT GGCTCGACGA AGGTGACATG AAAGCATTCG TTAAAGGTAA ATACGGTGTT 
CATTCCCAGT CGGCGCAGGC TATAGTGGAA ACTTACTTTG AGTGCTGTGA GCGCACCGGG 
AAGCTGCGCG AACAAGGAGT TACAGATTGG CGCTATCCCC ATCGCAGGAA ACGTTTTTTC 
ACTGTAACCT GGAAGCCACT TGGTATAAAT TACGAAGGAA AGATGCTGAC TCTCTCAAAC 
GGACGCGGCA GGGAATCACT CATACTTAAC TTACCCAAAA GGCTCTCCGG AGCCGTCATT 
AAGCTGGTTC AACTTGTATG GCACCGTAAC CTTTACTGGC TGCATGTAAC GGTAGAAAAA 
CCGGCCTTGA AAAAAGTACA GGGCGGCGTT ACAGCAGCCA TTGACCCCGG TGAGGTACAT 
GCTGTAGCTA TCACAGACGG TAAGAAATCT TTGGTAGTGA GCGGCAGATT GCTGCGTTCT 
CTGCACCGGC TCAGGAATAA GGTGCTGCGC AGGTTGCAAA AAGCTATTTC TAAAACTAAA 
AAAGGCTCAA AACAGCGCAA TAAGCTTTTA GCTGCAAAGT ACCGGTTTTT GAACAATATT 
GAGCGCCGAA TTGAGCACGT CATACATACC ATTTCAACTA TTGTTTCAAA ATGGTGCTTT 
GAGCATAACG TCAATACCGT CTATATCGGC AATCCAGAAG GCGTGCGCAA GAAAGACTGC 
GGTAAAAAGC ACAACCAGCG GATGAGTCAA TGGACTTTCG GTAAATTACG CAGGATGCTG 
GAGTATAAGT TAAAGCGTCA TGGCATTAAG CTGATATCAG TGGATGAACG CGGTACTTCG 
GGTACTTGTC CAGCTTGTGC AGAGTATACC AAGCAAACAG GTCGCACCTA TAAATGCGGC 
AAGTGTGGTT TCGCCGGCCC GCACCGGGAT ATGGTCGGTG CTTCCGGAAT TCTGGATAAA 
TCGGTTAACG GTAAATTCAC CAAAGGCCGT AAGTTACCTG AGAAGGTCGA ATATGCACGA 
CTGAAGGTGT TGGCACTGAA AAAAACTGCT TAA

Protein sequence

MSKCKNNQSK KSKSKGIDIL VNKFPVYLTP EQTFLARTLQ REAAKVWNTT CTVHRTIYIK 
HHCWLDEGDM KAFVKGKYGV HSQSAQAIVE TYFECCERTG KLREQGVTDW RYPHRRKRFF 
TVTWKPLGIN YEGKMLTLSN GRGRESLILN LPKRLSGAVI KLVQLVWHRN LYWLHVTVEK 
PALKKVQGGV TAAIDPGEVH AVAITDGKKS LVVSGRLLRS LHRLRNKVLR RLQKAISKTK 
KGSKQRNKLL AAKYRFLNNI ERRIEHVIHT ISTIVSKWCF EHNVNTVYIG NPEGVRKKDC 
GKKHNQRMSQ WTFGKLRRML EYKLKRHGIK LISVDERGTS GTCPACAEYT KQTGRTYKCG 
KCGFAGPHRD MVGASGILDK SVNGKFTKGR KLPEKVEYAR LKVLALKKTA