Gene DvMF_3158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_3158
Symbol
ID	7175104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	3982747
End bp	3984048
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	65%
IMG OID	643541694
Product	carboxyl-terminal protease
Protein accession	YP_002437562
Protein GI	218888241
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.0549247
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGTGA CGCTGTGGAC GGCCACGCTG CTCATTCTTG GCGTGCTCGC CATTTCCGGC 
GGGGCGGCGC TGGTGCCCGA CACCGTCGGT GCAGCCAGTG AGGAAGGCAA ATACGACTCG 
CTGAAGCGCT TCAGCCAGGT GCTCGACCTG GTGGAGCGCT ATTACGTGCG CGACGTGCCC 
CGCAAGGACC TGATCAACGG GGCCGTCAAG GGCATGCTGC AAGGGCTGGA CCCCCATTCG 
ACGTTCCTGT CGGTGGAGGA GTTCAAGGAG ATGCAGGAAA GCACCTCCGG CGAATTCTTC 
GGCATCGGCA TCGAAATTTC CAGCGAGAAC GGCCAGCTCA TCGTGGTGGC CCCCATCGAG 
GACACCCCCG CCCACAAGGC GGGCCTGAAG AGCGGCGACA TCATCCTTGC CGTGGACGGC 
GTGCCCACCC AGGACATGAC CACCCAGGAA GCGGTCACCC GCATCCGTGG CGCCAAGGGC 
ACCGAAGTGG AGCTGTCCAT CCTGCACCGC GACGCCAAGG CCCCCGAAGT GGTGCGCCTG 
GTGCGCGACG CCATTCCGCT CATCAGCGTC AAGTCCAAGA TGCTCGAGGA CGGCTACCAC 
TGGGTGCGCC TGACCCGCTT CAGCGAACGC ACCACCGGTG AACTGGTGGA CGCGTTGAAG 
GAAGCCAACA AGAAGGGCAT GAAGGGCATC ATCCTCGATC TGCGCAACAA CCCCGGCGGG 
TTGCTGGACC AGGCCGTGAG CGTGTCCGAC ACCTTCCTGA AGGACGGGGT CATCGTGTCT 
ATCCGTGGCC GCATGGAAGA CGCCAGCCGG GAATACCGGG CCAAGGCCCA GCCCGGCGAC 
GTGACCGTGC CCATGGTGGT GCTGGTCAAC GCCGGTTCCG CCTCGGCCTC GGAAATCGTG 
GCCGGTGCCC TGCGTGACCA CAACCGCGCG CTCATCCTGG GTGAACGCAC CTTCGGCAAG 
GGTTCGGTGC AGAACGTCAT CCCGCTGTCC GACGGCGCGG GCCTGAAGCT GACCGTGGCC 
CTGTACTACA CGCCTAATGG CCGCTCCATC CAGGCGGAAG GCGTGGAGCC CGACTTCGAG 
GTGCCTTTCG AACTGCCGCG CGAGGAAGAA AAGGCCCACC GCCTGAACAT GGTGCGCGAA 
AAGGATCTGA ACCGCCACCT CGAGAACGGT TCTTCCGGCA AGGATGCGCG TCCTTCGGCC 
AAGGCCGCGG ACGACGTGAA GCAGGCCCTG GAAAAGGACA ACCAGCTGCG CATGGCGTTG 
CAGTTCGTGA AGCGCCTGCC CCGCCTCAAG GATATCCAGT AG

Protein sequence

MRVTLWTATL LILGVLAISG GAALVPDTVG AASEEGKYDS LKRFSQVLDL VERYYVRDVP 
RKDLINGAVK GMLQGLDPHS TFLSVEEFKE MQESTSGEFF GIGIEISSEN GQLIVVAPIE 
DTPAHKAGLK SGDIILAVDG VPTQDMTTQE AVTRIRGAKG TEVELSILHR DAKAPEVVRL 
VRDAIPLISV KSKMLEDGYH WVRLTRFSER TTGELVDALK EANKKGMKGI ILDLRNNPGG 
LLDQAVSVSD TFLKDGVIVS IRGRMEDASR EYRAKAQPGD VTVPMVVLVN AGSASASEIV 
AGALRDHNRA LILGERTFGK GSVQNVIPLS DGAGLKLTVA LYYTPNGRSI QAEGVEPDFE 
VPFELPREEE KAHRLNMVRE KDLNRHLENG SSGKDARPSA KAADDVKQAL EKDNQLRMAL 
QFVKRLPRLK DIQ