Gene Dtox_2994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_2994
Symbol
ID	8429984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3185218
End bp	3186318
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	43%
IMG OID	645035248
Product	Radical SAM domain protein
Protein accession	YP_003192371
Protein GI	258516149
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00145585
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.391108
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGATA AGCAAATTTG TTTCATTGTA AAAGTTACGA CACGCTGCAA TCTTGCTTGC 
AGTTACTGTT ATGAAGAAAA GACCGATGAG GACATGGACC TTTCAGTAGT AGAATCTTTG 
ACACAAAAGG CTTTAGCCGC TACTTCCCGT GTGCAGTTTT GCTGGCATGG CGGGGAAACT 
TTGCTAAGGG GAATCAGTTT TTATGAAGAG GTGGTTTCCT GCCAGAAGAG ATTCAGGGGT 
GAGCACAATA AAATCTTAAA TACTCTGCAG ACTAATGGCT TATTGTTGGA CGAGGACTGG 
TATGCCTGGT TTTCCGGGAG CGGGTTCAGA GTGGGGATTT CCTGTGACGG TCCTACCTGC 
CATGATATAA ATCGCAAAAC CATTGCCGGT AACGGGTCCT TCAAAAATAT ATTGACTACC 
TTATCAAAGA TGCGAGAGAC TAAAAATGAC CGGCTTTGTG GGGGATTACT GGCAGTTGTA 
ACTCCTGAAA TGCTGGAACA CAGTGAAAAT TTGTTGGAAG AATTTATTTT GCTTGGGGTT 
AAAAAGCTTG ACTTTTTAAG GTACAAAGCA CCGGACGGTG GGCTTTCAAC TGAAGAATAT 
TACGGTTTTA TAAGAAGCAT TTTTAACCAG TGGCTTAAAC TGGATGATGC TTCACTCAAA 
ATTCGCACCA TCGACAGTAC CTTGAATTAT TTTATCCGTG GCAAATCACG TCTTTGTCGT 
TACCTTGGTG ACTGTAAGAG ATTTTTGACC GTAAGGCCAA ATGGCGATGT ATACCCTTGC 
GAGTGCCTGC ATGGTAGTTC TATGTATCTT AAGTTAGGAA ATATCCTGCT GGACGATTTA 
AATGATATCT ACAGAAAGGC TGGGCAGGTA ATCAAGCAGC ATAAATTACC GCCTTCCTGC 
AGCGACTGCT TCTTTACCGC CCTCTGTCGT AATGCATGTG CCGGGGCGGA AAGGCTGGAA 
GGAGTGTGTT TAGAGAAAAA AATGTTCTTC CGGGATATCT CTAATTTGGT TCAAACAGTA 
CGAGAAAAAA ATGTAAATGC AGAAAGGAGG TCGTGGTTGT GGGTAGCAGC AACATTGAGA 
ATGATATTGC AAGGAGATTA G

Protein sequence

MDDKQICFIV KVTTRCNLAC SYCYEEKTDE DMDLSVVESL TQKALAATSR VQFCWHGGET 
LLRGISFYEE VVSCQKRFRG EHNKILNTLQ TNGLLLDEDW YAWFSGSGFR VGISCDGPTC 
HDINRKTIAG NGSFKNILTT LSKMRETKND RLCGGLLAVV TPEMLEHSEN LLEEFILLGV 
KKLDFLRYKA PDGGLSTEEY YGFIRSIFNQ WLKLDDASLK IRTIDSTLNY FIRGKSRLCR 
YLGDCKRFLT VRPNGDVYPC ECLHGSSMYL KLGNILLDDL NDIYRKAGQV IKQHKLPPSC 
SDCFFTALCR NACAGAERLE GVCLEKKMFF RDISNLVQTV REKNVNAERR SWLWVAATLR 
MILQGD