Gene Daro_0071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0071
Symbol
ID	3569710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	85185
End bp	86354
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	62%
IMG OID	637678506
Product	peptidase M20D, amidohydrolase
Protein accession	YP_283300
Protein GI	71905713
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	65
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCGA CCCCACCTTT GCTCGATCTG CCTTTTCTGG CCGAACTGAC TGCCCTGCGG 
CGCGATATTC ATGCCCATCC GGAACTGGCT TTTGACGAGA ACCGGACGGC CGATATCGTG 
GCGCGCGAAC TTCAGCGTTA CGGCCTGGAA GTGCATCGCG GTATCGCCAA AACTGGCGTC 
GTCGGGGTGT TGCGAGCCGG TACTGCGCAG CGCATGATTG GCCTGCGCGC CGATATGGAC 
GCGCTACCAC TCGCCGAGTT GAACGAGTTC CCTCACCACT CGAAGCATGC CGGCAAGATG 
CACGCCTGTG GCCATGATGG CCATACGGCG ACGCTGCTCG GCGCGGCGCG CTATCTGGCG 
GAAAAGCCCG ATTTCGACGG CATCGCCGTG TTCATTTTCC AGCCGGCCGA GGAGTCGGAA 
GGCGGGGCGG CGGTCATGAT CGAGGATGGC CTGTTTGAGC GCTTCCCGGT TGAGGCAGTG 
TTCGGTCTAC ACAACTGGCC AGGCATCCCG GTCGGTGAAA TGATGGTTAT GCCGGGGCCA 
GTGATGGCGG GAACCTGCGC TTTCGAGATT TTTGTGCGTG GCCATGGCTG CCATGCGGCC 
ATGCCGCATC AGGGGGTCGA TTCCATCGTC GCCGGAGCCC AATTGGTCCA GGCGCTTCAG 
ACGGTGGTAG CGCGTACCCT GCATCCGTGC GAGTCTGCCG TGGTCAGCGT AACGCAGTTC 
CATGCCGGTG AGGCGTGGAA TATCATTCCC GAGGAAGTGG TGCTGCGCGG TACGATTCGC 
ACCTTCAAGC CGGAGGTTCA GGAAGCCGTC GAGCGGGCCA TTGAGCGTCT GTGCAGCGGC 
ATCGCAGCGG CCAACGGGGC GCAGATCAGT GTCCGCTTTG ATCATCGCTA CCCGCCGACG 
GTCAATAGCC TCGCCGAGGC GAAGTTCTGT CAGCAGGTGG CCGCCGAGGT TTTTGGGTCG 
GACAAGGTGC TGACCGACAT CCTGCCGTCG ATGGGCGCCG AGGATTTTGC CTACATGCTG 
AACGAAAAGC CCGGCTGCTA CGTCTGGCTC GGCAATGGGC CGGGTACCGG CGGCTGCACG 
CTGCACAACC CGCACTACGA TTTCAACGAC GAACTGCTGA CGCTCGGTAC GAGCTACTGG 
GTAAATCTGG TTCGGCGCTG GCTACGCTGA

Protein sequence

MPPTPPLLDL PFLAELTALR RDIHAHPELA FDENRTADIV ARELQRYGLE VHRGIAKTGV 
VGVLRAGTAQ RMIGLRADMD ALPLAELNEF PHHSKHAGKM HACGHDGHTA TLLGAARYLA 
EKPDFDGIAV FIFQPAEESE GGAAVMIEDG LFERFPVEAV FGLHNWPGIP VGEMMVMPGP 
VMAGTCAFEI FVRGHGCHAA MPHQGVDSIV AGAQLVQALQ TVVARTLHPC ESAVVSVTQF 
HAGEAWNIIP EEVVLRGTIR TFKPEVQEAV ERAIERLCSG IAAANGAQIS VRFDHRYPPT 
VNSLAEAKFC QQVAAEVFGS DKVLTDILPS MGAEDFAYML NEKPGCYVWL GNGPGTGGCT 
LHNPHYDFND ELLTLGTSYW VNLVRRWLR