Gene Dtox_2083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_2083
Symbol
ID	8429065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	2260057
End bp	2261607
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	42%
IMG OID	645034404
Product	DSH domain protein
Protein accession	YP_003191535
Protein GI	258515313
COG category	[L] Replication, recombination and repair
COG ID	[COG4581] Superfamily II RNA helicase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00750043
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGTATG AAGATAATTC TGTTTATAAC AGCATTACCG AAACAGTCAA GGACCGTTTG 
CCGGCACTTT TTTTCGTTTT TAGCCGGGGA AAAACAGAAC TTATTGCCGA AGAGTTAAGC 
CATGATTGGG ATTTTTTAAA ACCCGCTGAA AAGAAAACAG TACAGCAAAT AGTTGCTGAT 
TTCGAAAAAC AAAACCCAAC TGCTTTTGAA CGTAAAAACA GAAGACTTTT AAAAAGACTG 
CTTAGCCGTG GTATCGGCTA TCATCATGCC GGGCTGTCGC CGGTCTTGAA AAATCTAGTA 
GAGACGCTTT ATGAGCGAAG GCTTATTTAT GCCTTGTGCT GTACTGAGAC CTTTGCTGCC 
GGGGTTAACT TTCCGGCTTG CAGTACCATC TTTGATTCCT GCCGGAAGTG GGACGGCAAA 
ACCTTCCGGG GGCTTTTAAA CCGTGAATTT TTTCAAATGG CAGGCAGGGC GGGCCGCCGT 
GGATTTGATG AAAAGGGTTA TGTTTTTGTT CGTATTGATG AGCAGTACCC GGAGCAAACA 
ACTTTCTTTG ATGAAGATGA AGTGGAATCA GTTAACAGTC ATTTAACCAT ATCGCCAAAT 
ACTGCGTTAA ACCTTTTGCA GTGGAAAACA GATGCGGAAA TTGAGCATTT TTTAACCAAT 
AATTTTGCGG TTTACCAGGG TAAAAAGGAA GAAAGAGCTG TTAATATTGA TATTGAAGCC 
ATTACTGCTG AGATAGAAAA TTTGGAACAG CATTTTTGCG AAGAAAGAGA TACTCGTACC 
TGTGCGCTTT ATCGCAAAAA ACTAAAGAAG GAACTGTATA AGCATTACCG GAGACGCAAA 
AATAACCCGG ATTACCAGTC AAAAATAGAT GAGATCAAAG AAATCCTGGA CTTACCGGCC 
AGAGATTGCG CCCATTCATT ATGTTTTTCA GCAAAGAGAA ACCTGGGTAA ACTTGTTTCA 
GAAAGAAAGC GCTTAAACCG GCAGCGTGAA AAGCTGGCCG GGCAGCATGA AAATTACTTT 
GATAAGTTCT CCAGTGTTTG CAGTTTGCTG GAGCAGTTGG GCTATATTGA AGGACGCATT 
CTGCTGCCAA GGGGGATTTT TGCTTCAAAG ATACATATCC AAGAGATACT GGTTACTGAA 
CTGATCTTCT CAGGAATTAT GTCGGATGCC ACACCGGCAG AGATTGCTGC TATTATAGTT 
GGTATAGATT ATGAGGCCAA CAGAAGAGAT AAGATGATTC CCAATGTGGT AGACCTGTCG 
AAAGTTGAAG AATTGCATAG AGAACTGCAA AAAAGCAACG TACCGTTGCA CTTTTGCAGT 
TGGTCGCCTA TACCTGGTCC TCTCGCGTAT TTATGGCATG AAGGTAAAAG CTTTGGAAGC 
TTGCTGGAAA TGACGGAAAT GCAGGAAGGA GATATCTTTT CCATGCTGAG AAGAGAGATT 
GATTTATTAA GACAGATAGA ATCAGCATTA AAGGATGACC CGGCCTTGCA AGCCAAAATA 
CGCGGAGTCA GATTAAGCTT GGACAGGGAT GAAGTTTCTG TTTCGTTTTA G

Protein sequence

MRYEDNSVYN SITETVKDRL PALFFVFSRG KTELIAEELS HDWDFLKPAE KKTVQQIVAD 
FEKQNPTAFE RKNRRLLKRL LSRGIGYHHA GLSPVLKNLV ETLYERRLIY ALCCTETFAA 
GVNFPACSTI FDSCRKWDGK TFRGLLNREF FQMAGRAGRR GFDEKGYVFV RIDEQYPEQT 
TFFDEDEVES VNSHLTISPN TALNLLQWKT DAEIEHFLTN NFAVYQGKKE ERAVNIDIEA 
ITAEIENLEQ HFCEERDTRT CALYRKKLKK ELYKHYRRRK NNPDYQSKID EIKEILDLPA 
RDCAHSLCFS AKRNLGKLVS ERKRLNRQRE KLAGQHENYF DKFSSVCSLL EQLGYIEGRI 
LLPRGIFASK IHIQEILVTE LIFSGIMSDA TPAEIAAIIV GIDYEANRRD KMIPNVVDLS 
KVEELHRELQ KSNVPLHFCS WSPIPGPLAY LWHEGKSFGS LLEMTEMQEG DIFSMLRREI 
DLLRQIESAL KDDPALQAKI RGVRLSLDRD EVSVSF