Gene Dvul_0923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_0923
Symbol
ID	4663405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	+
Start bp	1135160
End bp	1136446
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	63%
IMG OID	639819146
Product	carboxyl-terminal protease
Protein accession	YP_966371
Protein GI	120601971
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.315177
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.478971
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTTA CGTTATGGGT GGTATCGCTG GGCCTGTGTG CCGCGGTCGC CTTTTCAGGT 
GGAGCAGTCT TCGCGACCAC CGAAGAGTCC AAGTATGACG CGCTGAAGCG CTTCAGTCAG 
GTGCTCGACA TCGTCGAGCG CTACTACGTG CGCGACGTGC CCCGCAAGGA CCTCATGAAC 
GGAGCGGTGA AGGGCATGTT GCAGGGGCTT GACCCCCACT CCACCTTCCT CTCCCCGGAA 
GAATTCAAGG AGATGCAGGA GACCACCTCT GGTGAGTTCT TCGGCATCGG CATCGAGATA 
TCCAGCGAGA ACGGGCAACT CACCGTTGTG TCGCCCATCG AGGACACTCC TGCGTTCAAG 
GCGGGACTCA AGGCGGGCGA CCTCATTCTC GCCGTCGATG GGCAGCCCAC GCAGGAGATG 
AGCACGCAGG AGGCCGTATC GCGCATTCGC GGGCCCAAGG GCAGCGAAGT GGAACTGCTC 
ATCCTGCATC GCGAAGCCAA GGCCCCCAGC ACGGTGAAAA TCGTGCGCGA CGCCATCCCC 
CTCGTCAGCG TCAAGTCGAA GCAGCTTGAG CAGGGGTACG TGTGGGTGCG CCTCACCCGC 
TTCAGCGAAC GTACGACCAG CGACCTGCTG GAAGCACTGC GCGAGGCGAA CAAGCGCGGG 
CCCGTCAAGG GCGTGGTTCT CGACCTGCGC AACAACCCCG GCGGTCTGCT TGACCAGGCC 
GTGAGCGTGT CCGACGTGTT CCTGCGTGAC GGGGGCATCG TCTCCATCCG CGGGCGCGGC 
GACGACACGG GGCGTGAGTA CAACGCCAAG GCGCAGTCCA CCGACGTGAC CGCGCCCATG 
GTGGTGCTCA TCAACGCCGG GTCTGCCTCC GCTTCGGAGA TCGTCGCCGG GGCCCTGCGC 
GACCAGAAGC GCGCGCTTCT GGTGGGTGAA CGCAGCTTCG GCAAGGGGTC GGTGCAGAAC 
GTCATCCCGC TTTCCGACGG CGCGGGACTC AAGCTCACGG TTGCACTGTA CTACACGCCC 
AATGGCCGTT CCATTCAGGC CGAGGGCATC GACCCTGACA TCGAGATTCC CTTCGAAGCC 
CCGCGTGAGG ACGACGCCAA ACCCATGCAG CGTTTCAACA TGTTGCGGGA GAAGGATCTT 
TCGCGTCACC TGGAGAACGG TGCCGGGGGC AAGCAGGGCA AGAACGACCA GTCTGCCGAG 
GTGCGTGACC TGCTTGAACG CGACAACCAG TTGCGCATGG CATTGCAGTT CGTGAAGCGG 
CTGCCCGCCT TGAAGGAAAT ACGCTAG

Protein sequence

MRVTLWVVSL GLCAAVAFSG GAVFATTEES KYDALKRFSQ VLDIVERYYV RDVPRKDLMN 
GAVKGMLQGL DPHSTFLSPE EFKEMQETTS GEFFGIGIEI SSENGQLTVV SPIEDTPAFK 
AGLKAGDLIL AVDGQPTQEM STQEAVSRIR GPKGSEVELL ILHREAKAPS TVKIVRDAIP 
LVSVKSKQLE QGYVWVRLTR FSERTTSDLL EALREANKRG PVKGVVLDLR NNPGGLLDQA 
VSVSDVFLRD GGIVSIRGRG DDTGREYNAK AQSTDVTAPM VVLINAGSAS ASEIVAGALR 
DQKRALLVGE RSFGKGSVQN VIPLSDGAGL KLTVALYYTP NGRSIQAEGI DPDIEIPFEA 
PREDDAKPMQ RFNMLREKDL SRHLENGAGG KQGKNDQSAE VRDLLERDNQ LRMALQFVKR 
LPALKEIR