Gene Dtox_3203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3203
Symbol
ID	8430197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3404481
End bp	3405506
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	47%
IMG OID	645035449
Product	membrane-associated zinc metalloprotease
Protein accession	YP_003192568
Protein GI	258516346
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000432825
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00000345421
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCACAT TTTTTGCGTC CGTATTTGTC TTTGCTATGT TGATATTTTT TCATGAGCTG 
GGGCACTTTG CTGTAGCAAA ATTAGCAGGT ATTAAGGTTC ATGAATTCAG TGTGGGCTTC 
GGCCCCAAGC TTTTTGGCAA ACTACACGGT GAAACTACTT ATAACCTGAG ACTTTTGCCG 
CTGGGAGGTT TTGTCCGTAT GGCCGGCATG GATCCTGCGG ATGAAGCGGA TTATGCTGAT 
GAGAGGGCTT TTAACAAGAA ATCCATCCTC CAGCGTATGG CGGTAATCTT TGCCGGGCCG 
CTGATGAATT TTTTTCTGGC AGCTCTGCTT TTGGCCTTTA TATTTATGGC TCAGGGTTAT 
CCCGCCGGTA CCACCACCGG TGTGGATAAG GTGCTGCCCG GTTATCCGGC GGAAAAGATT 
GGCCTGGTAT CGGGCGATAA AATTGTGGCT ATTGATGGCC GCAGCATGGA TAGCTGGGAG 
CAGGTGGCTG AATATATTAA CCAGCGCCCG GATAAGCAAA TTGTTATTAC GGTAGAAAGA 
GATGCGGCCA AGCGCAGCTT TGATATAGTT CCGGTTAAAG ATGAAAGCGG TCATGGCAAG 
ATCGGCATTT ATCCCGCACA GGAAATGAAG AAGATGGGTT TTTTTACCGC TCTCTATTCC 
GGTGCTGAGT ATACAGTTAA GGCAACCTGG TTTATAATTA GTTTTATTGG CAAGATGTTT 
GTGCATGAAG CTCCTGTTGA TTTAGGCGGG CCGGTCAGGG TTGTTTGGGA AATCGGTCAG 
GCGGCTAATA CTGGCTTTTA CCACCTGCTG CAGCTTGCTG CTTTCCTGAG TATTAACCTG 
GGTCTTTTTA ACTTGTTTCC TATTCCTGCC TTAGACGGCA GCAGGGTGGT TTTCTTGTTC 
TGGGAAGCGC TGCGCGGCAA ACCGGTGGAT CCCTCCAGGG AGAGCTTTAT TCACCTGGTT 
GGTTTTGTCC TGCTGCTGGT TTTGATGGTG GTCATTACTT ATAATGATTT GTTGAATTTA 
TTGTAA

Protein sequence

MSTFFASVFV FAMLIFFHEL GHFAVAKLAG IKVHEFSVGF GPKLFGKLHG ETTYNLRLLP 
LGGFVRMAGM DPADEADYAD ERAFNKKSIL QRMAVIFAGP LMNFFLAALL LAFIFMAQGY 
PAGTTTGVDK VLPGYPAEKI GLVSGDKIVA IDGRSMDSWE QVAEYINQRP DKQIVITVER 
DAAKRSFDIV PVKDESGHGK IGIYPAQEMK KMGFFTALYS GAEYTVKATW FIISFIGKMF 
VHEAPVDLGG PVRVVWEIGQ AANTGFYHLL QLAAFLSINL GLFNLFPIPA LDGSRVVFLF 
WEALRGKPVD PSRESFIHLV GFVLLLVLMV VITYNDLLNL L