Gene Dde_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dde_3033
Symbol
ID	3758025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio desulfuricans subsp. desulfuricans str. G20
Kingdom	Bacteria
Replicon accession	NC_007519
Strand	+
Start bp	3020408
End bp	3021565
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	58%
IMG OID	637783941
Product	peptidase M20D, amidohydrolase
Protein accession	YP_389522
Protein GI	78358073
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGTGA AGCCGGAAAT CGAGGCCCGT TTCGAAGAGC TGAAAAGCAT ACGCCAGTAC 
CTGCACTCCT GTCCCGAAGT GGGTCTGGAA ACAGTGAATA CCGCAGCGTT TGTAAAAAAA 
CAGCTGGACG GACTGGGCAT CGGATATGAA GACATCGGCG TCAACTCGCT GCTGGCCAAA 
GTGGAAGGCA CTGCTCCCGG CGTGACAGTG GCCTTCCGGG CCGATATGGA CGGACTGGAA 
ACCTGCGAAG AAACCGGCCT GCCGTATGCT TCGCAGACCT GTGGCCGCAT GCATGCGTGC 
GGCCACGACG GCCACACCGC CACGCTGCTG GCTTTTGCCG GGTATCTGGC GCAGCACCGC 
GATTTCAAAG GAACCGTGCT GCTGTTGTTC CAGTCCGGAG AAGAAGGCTA CGGCGGAGCG 
CTGGAAGTCA TCAAAGACGG TCTGTTTGAA AAATACAGCA TCGACTACAT GTTCGGCATG 
CACAACTGGC CGCCTTACGG CGAAAACCAG ATGATAGTGC ACAAAGGCAC CGCCATGGCC 
TCCGAAGACC GCTTCGATCT GGTCATACGC GGCAAAAGCG GACACGCCTC CGTTCCGCAC 
GCCTGCAACG AACCTTTCGC CGCAGTGGCC GACTTCATAA AAAACGCGCA GAGCATTGTT 
GCCCGGCGCA TTTCGGCACA TGACAAAGGC GTCATAAGCA TCACACAGGT ACACGGCGGC 
AGCGCCTACA ACATCATTCC CGACGAAGTG ACCATACGCG GCAACGTGCG TACCACCGAC 
CCGCGCGTGC AGGACCTCAT CGAGGAATCG CTGGCACAGC TGGCGCAGGG ACTCGAGGTG 
ACCTACGGCG TAAAAGCCGC CTTCACCTAC CACCGCAAGC ACCCGCCGGT CATCAACTCC 
ACGCCGGATA TGGCCATAGC CGCCGCGGCG CGTGTGGTGG GACAGGAAAA CGTGCTCACT 
GAAGAACTGC CCGCCATGGG CAGCGAAGAC TACGCCTTTT ACATGCAGAA AACCAAAGGG 
TGTTTTGTAT GGATAGGCAA CGGCACGGAT TCCGCGCTGA TACATAACAG CAAGTACGAC 
TTCAACGACA AGATCATTCT TCTGGGAGCT TCGCTGTTTG CGGAGTTGCT GGACGAGGTG 
CTGTCGGCAC AGCCGTAA

Protein sequence

MPVKPEIEAR FEELKSIRQY LHSCPEVGLE TVNTAAFVKK QLDGLGIGYE DIGVNSLLAK 
VEGTAPGVTV AFRADMDGLE TCEETGLPYA SQTCGRMHAC GHDGHTATLL AFAGYLAQHR 
DFKGTVLLLF QSGEEGYGGA LEVIKDGLFE KYSIDYMFGM HNWPPYGENQ MIVHKGTAMA 
SEDRFDLVIR GKSGHASVPH ACNEPFAAVA DFIKNAQSIV ARRISAHDKG VISITQVHGG 
SAYNIIPDEV TIRGNVRTTD PRVQDLIEES LAQLAQGLEV TYGVKAAFTY HRKHPPVINS 
TPDMAIAAAA RVVGQENVLT EELPAMGSED YAFYMQKTKG CFVWIGNGTD SALIHNSKYD 
FNDKIILLGA SLFAELLDEV LSAQP