Gene Dtox_3963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3963
Symbol
ID	8430978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	4146896
End bp	4148047
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	46%
IMG OID	645036181
Product	carboxyl-terminal protease
Protein accession	YP_003193279
Protein GI	258517057
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000206146
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000000432275
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGGCGGA GATTTGGTAC CGGGCCAAGA TGGTCAATAG TTGTTGTTGG CCTGGCGGTG 
TTGTTATTTG CCGGTGTTGT ATTTGCCGGT GGGATAATAG CGGTAAACTA TAAACATATG 
GGAAACCTGG TGAGGGTAAT ATCACTGGTG CGTTCTCAAT ATTTACACCC GGTTGAAACG 
TCTGATTTAA TTGACGGCGC GATTAAGGGT TTGGTTGATT CCTTGCATGA TGAGTATTCA 
GTCTACTTGG AACCTAAGAC CTATGCGCAG CTCCAGGCGC AAATCAGGGG TTCCTTCGGA 
GGTTTAGGTA TTTTAGTCGG TGTTAAGGAT GATTATTTGA CAGTAGTGCG GGTTTATGAC 
AACACTCCCG CGGCCAAAAA AGGGATTAAA GCCGGAGATA AGATTGTAAA AATCGGTGAT 
CAGGACGCGC AAGGAATACA TTTGGATAGT GCGGTGGAAT TAATGCGAGG GGCGGTTGGT 
TCGAAAATTA AATTGACAGT AAAAAGAGAG CATGAGCCTG AATTGCTGGA AATTAATCTG 
GTCAGGGAAG AAATCAGTGT TCCTACTGTG GAAGGCAAGG TTATAGAGGG TACCGATATA 
GGTTATATGG TGCTTAGCCA GTTTTCTGAG AAAACTCCTG ATGAGTTGGA TAAGGTATTG 
TCTGATTTAG AGAGAGAGGA TATCAAGGGA ATTATTTTGG ACCTGCGGGA CAACCCGGGT 
GGCGAATTGG TTTCGGCTAC CAAGGTGGCT AATTATTTTT TGCCGGCCGG TCCCATTGTT 
TATGTAGACT ACCGGGTGGG CAAGGATCAG ACTTTTACTG CGGACGGGCA TAGAGTGAAA 
CTTCCGCTGG TGGTACTGGT GAATGGCAAC AGCGCCAGCG CAGCGGAAAT TTTGTCAGGG 
GCAATAAAGG ATACCGGCGC GGGAACTCTT GTCGGAGAAA AGACCTTCGG TAAAGGTATT 
GTGCAGACGG TATTTCCCCT GGATAACGAG GCGGGCCTGA AGCTGACCAC GGCCAGGTAT 
CTGACTCCTA AAAAGAAGGA TATTCATAAA AAAGGAATCG AGCCTGATGT AGAGGTTAAG 
CAGAAACCAA ATGCCCAGCC TGATTTGCAG TTTGAAAAAG CTATAGAAAT TATGAAGCAG 
AAGATATCAT AA

Protein sequence

MRRRFGTGPR WSIVVVGLAV LLFAGVVFAG GIIAVNYKHM GNLVRVISLV RSQYLHPVET 
SDLIDGAIKG LVDSLHDEYS VYLEPKTYAQ LQAQIRGSFG GLGILVGVKD DYLTVVRVYD 
NTPAAKKGIK AGDKIVKIGD QDAQGIHLDS AVELMRGAVG SKIKLTVKRE HEPELLEINL 
VREEISVPTV EGKVIEGTDI GYMVLSQFSE KTPDELDKVL SDLEREDIKG IILDLRDNPG 
GELVSATKVA NYFLPAGPIV YVDYRVGKDQ TFTADGHRVK LPLVVLVNGN SASAAEILSG 
AIKDTGAGTL VGEKTFGKGI VQTVFPLDNE AGLKLTTARY LTPKKKDIHK KGIEPDVEVK 
QKPNAQPDLQ FEKAIEIMKQ KIS