Gene Dtox_3964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3964
Symbol
ID	8430979
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	4148228
End bp	4149358
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	47%
IMG OID	645036182
Product	Peptidase M23
Protein accession	YP_003193280
Protein GI	258517058
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000173675
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000000427958
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGGTTGG TCAAAAAGGT AATTGCTTGG GGCCTGACTG TTGTGCTGTT GGGTGCGGCT 
ATTGGTACTG CCGGTGCTAA AACGCTGGAA CAACAGCTGA AGGATACCCG TGCGCAGATA 
CAGCAGACAC AGAAGGGTGT CAATGAAAAT AAATCAGATA TCAAGAACTT TACCTCTCAA 
TTAGCATCAA TCAACCAGTC TATCAACCAG GTTAGCGTTG AAATCAGGGA GTTGGAAGGT 
AAATTAGGTG TTACCCAGAA CAAGCTGCAG GGTATCATTA ACGAGCTTAG AAAGGTAGAG 
GCCAGGCTTG CGGAGACACA AGAGGTTTTT AATACAAGGA TTAAGAATAT ATATGTAAAC 
GGGAATGTCA GCTATCTGGC TGTTCTTCTT GACTCCCAGG ATTTCGGTGA TTTTGTAAAT 
CGCTATGAAA TGTTAAAACG AGTGGCGGCC CGTGACGCGG CTATAGTTGA GCAGGTCGAA 
AATGATCGCA AGCTTATTGT CAGCCAGAAG GCGGAAGTGG AAAAAGAGCG CAATCGCATT 
TATGAGCTAA AGAGGCGGCA GGAAGACGCG AAGCATGCTT TGACTGCCCG TCAGGCTGAA 
CGGGAGACGC TTCTGATCGA GGCCAATAAG GATTTGGCTA AGAAAGAAGC GGAAATGGAT 
GCTCTGGAGG CTAAAGAACA GGAAATCATA AGGCAGATTG CCATTAGGAG CGCGCAGCAG 
AATAAAGATA TTAAGAAATA TACCGGTCAG TTTATTTGGC CTGTGTCCGG CTATACCAGT 
ATATCTTCTC CTTTCGGTTA TCGCAAGCAC CCGGTTTTAG GTACTGCGAA ATTTCATTCC 
GGTATAGATA TTCCCGCGCC AAACGGAACC AGTGTAATGG CGGCTCAGAG TGGAACTGTT 
ATTCAAGTGG GCAGCATGAC CGGTTACGGC AATATAGTGA TGATTAACCA CGGGGGCGGA 
TTAATCACTC TGTACGCTCA CTTATCGCGA CAGCTTGTAA GCAGCGGCCA GCAGGTTACC 
CGGGGACAAG TTATAGCCAA GGTAGGCAGC ACCGGAATGT CTACAGGCCC GCACCTGCAT 
TTTGAAGTAA GACTCAACGG TTCCGCAGTC AACCCGATGG GGTATTTGTA A

Protein sequence

MRLVKKVIAW GLTVVLLGAA IGTAGAKTLE QQLKDTRAQI QQTQKGVNEN KSDIKNFTSQ 
LASINQSINQ VSVEIRELEG KLGVTQNKLQ GIINELRKVE ARLAETQEVF NTRIKNIYVN 
GNVSYLAVLL DSQDFGDFVN RYEMLKRVAA RDAAIVEQVE NDRKLIVSQK AEVEKERNRI 
YELKRRQEDA KHALTARQAE RETLLIEANK DLAKKEAEMD ALEAKEQEII RQIAIRSAQQ 
NKDIKKYTGQ FIWPVSGYTS ISSPFGYRKH PVLGTAKFHS GIDIPAPNGT SVMAAQSGTV 
IQVGSMTGYG NIVMINHGGG LITLYAHLSR QLVSSGQQVT RGQVIAKVGS TGMSTGPHLH 
FEVRLNGSAV NPMGYL