Gene Dtox_1983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_1983
Symbol
ID	8428965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	2139991
End bp	2141703
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	44%
IMG OID	645034310
Product	Nitrilase/cyanide hydratase and apolipoprotein N- acyltransferase
Protein accession	YP_003191441
Protein GI	258515219
COG category	[R] General function prediction only
COG ID	[COG0388] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.314908
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0215342
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGGGAA AATTCCAAGA AGAAAATGCA GACCAGGAAG TTAAATTTGC CTTAATCCAT 
CCTGCTTTGG AATGGAAGAA TAAAGAAAAC AATATCCAAA AACTAATGAT TTTGAATGAG 
AAGGCCGCCA GTGAGGGTGC CAGGATAATT TTAAATACAG AAATGGCTGC AACAGGCTAC 
TCCTTTGCCG GCAGTTCTGA GATTGCTCCA TTGACAGAAG TTATACCAGG TCCTACTACT 
GAGCGCTTTG GCAGCATTGC CCGGAAATAT CATTGTTATA TTTGTATCGG GCTGCCGGAA 
GTGGATCCAG GAGTAGGTAG TTTATATAAT TCAGCAGCCC TGATTGGACC TGATGGTGAA 
GTGATCGGTA AGTACCGAAA GGTTTTTCCG GCTTTTAAAG AAAACCTTTG GGCCAGAAAA 
GGGAATCTTC CCATACTGGT GGCAGAAACT GAGTATGGTA AGTTGGGAGT GATCATTTGT 
GCCGATGCCT ATTCCTATAA GCCGCCTAGG ATTGCAGCTT TAAAAGGCGC CAGATTGCTG 
CTCATATTGG CCAACTGGCC CCCTCACCAC CATAACCCGC AGGATATCTG GCGTGCCCGG 
GCGGTTGAAA ATGGGATATA TATACTGGTC TGTAATCGGA CAGGAAAAGA TAAGACTATG 
AACTATATTT TTGCCGAATC TTTCATTATT GACAATAAGG GAAAGATAAT AACAAGAATG 
CAATCGGCAG AGGATACCAT TATTTATGGG ACAGTGCCAT TGGTAAAGGG AACCTTTATC 
TCGTCAGCAG ATTTCATTCT TGGCCAGAGA CAGCCCGAAT TGTATGGAAA AATATCTTTA 
GATACTTTTT CCCAGCCGGT CCCGGAGGCG CTTCTCAGTC TGCCCGAGCC TAAATTATTT 
GGTGTGGCGA CTGTGCAATT TCGCCCCGTC GCTGAAAAGG TGGAAGAGAA CAGACAAAAG 
ATGCTGGAAT TGATTGACCG GGCAACAGCT GTTGCCGCCC AAAAGGGTAT AGAGCTTAAC 
CTTATTCTTT TCCCTGAATT AGCTGCCACA GGAGCTATTT CAGATGCTCG CAAGATACAA 
GAACTTGCCG AAGAGATTCC GGGTGCCGGT ACAGCGGTGT TCACCGAGAA GGCCGGAGAG 
AACAATGTTT ACATAGTGCT GGGGATAGTG GAAAAGCAAG GAGTGGACTA TTTTAATACC 
GCTGTTTTAA TCGGAGCCGA GGGGATGCTG GGGAAATACA GAAAGGTGCA TCTTACCTCA 
CAGGATAAAA CATGGGCCTG TGCGGGAAAA GAAGGTTTCC CTACTTTTGA TCTCCCTTTT 
GGCAGAGTGG CTATTTTAAT CGGTTATGAT CTGATTTTTC CTGAAAGTGT TGAATGCCTG 
GCCAAGTGGG GTACTGATCT GCTATGTGTT CCCTCTCTTT GGGGTGATGA GAAGAGCAAG 
TTCATCTGGG AAGCCAGAAT AACAGAACAA ATGCATCTTG CTATAGCTAA CCAGTGGGGA 
GATTCCGGCG ATTATCAGTC CTTGGGAGAG AGCCTTATCT ATAGTTATAG TTCTTATCCG 
GAAAAGAGGA TAAGACGGAA ATCTCCTGCC GCAGGGGACA TGATTAATAT TTTAACGTTA 
AACTCAAAAA GTACCAGAGA AAAAAGGTTT TTGGAAAATA TAGATTACGA TATAATACTT 
GGAGTGACAA AAAGGGAAAA GATTAAGACG TAG

Protein sequence

MGGKFQEENA DQEVKFALIH PALEWKNKEN NIQKLMILNE KAASEGARII LNTEMAATGY 
SFAGSSEIAP LTEVIPGPTT ERFGSIARKY HCYICIGLPE VDPGVGSLYN SAALIGPDGE 
VIGKYRKVFP AFKENLWARK GNLPILVAET EYGKLGVIIC ADAYSYKPPR IAALKGARLL 
LILANWPPHH HNPQDIWRAR AVENGIYILV CNRTGKDKTM NYIFAESFII DNKGKIITRM 
QSAEDTIIYG TVPLVKGTFI SSADFILGQR QPELYGKISL DTFSQPVPEA LLSLPEPKLF 
GVATVQFRPV AEKVEENRQK MLELIDRATA VAAQKGIELN LILFPELAAT GAISDARKIQ 
ELAEEIPGAG TAVFTEKAGE NNVYIVLGIV EKQGVDYFNT AVLIGAEGML GKYRKVHLTS 
QDKTWACAGK EGFPTFDLPF GRVAILIGYD LIFPESVECL AKWGTDLLCV PSLWGDEKSK 
FIWEARITEQ MHLAIANQWG DSGDYQSLGE SLIYSYSSYP EKRIRRKSPA AGDMINILTL 
NSKSTREKRF LENIDYDIIL GVTKREKIKT