Gene Daro_0109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0109
Symbol
ID	3569954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	125273
End bp	126280
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	62%
IMG OID	637678544
Product	peptidase U32
Protein accession	YP_283338
Protein GI	71905751
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	72
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCCT TGCCCGATCT CGTTTGTCCG GCCGGCAGCC TGCCGGCACT CAAAGCCGCC 
GTCGATAACG GCGCCGACAC TGTCTACCTC GGCTACAAAA ACGACACCAA TGCGCGCAAC 
TTCGCTGGCC TGAACTTCGA CACCAAGACC ATGGCCGAAG GCATACGCTA CGCCCATGCC 
AAGGGTCGCG AAGTACTGAT GGCGATCAAC ACCTTCCCGC AGACCGGCCG GGTCGCCGAT 
TGGCACAAGG CCGTCGACGG TGCCGTTGAC CAGGGCGTGG ACGCCATCAT CCTGGCCGAC 
ATCGGCCTGC TCGACTACGC CCGCCAGCGC CATCCGCAAC AGCGCCTGCA TCTTTCCGTG 
CAGGGCTCGG CGACCAGCTA CGAAGCGATC AACTTCTGCC AGCGTGAATT CGGCATTCGT 
CGCGCCGTAT TGCCGCGCGT GCTGACGCTG GCCCAGGTCG AACATGTGAT CAAGAACACC 
ACAGTCGAAA TCGAAGTCTT CGGCTTCGGC AGCCTGTGCG TGATGAATGA AGGCCGCTGC 
TGGCTGTCTT CCTACGCCTG CGGTGAATCC CCCAATACCG TCGGCGCCTG CTCGCCGGCC 
AAGTACGTCA AATGGGACAA GAAGCCGGGC ACCATGGAAA CCCGTCTCAA CGGTGTCCTG 
ATCGACCGTT TCGGCGACGA CGAGCCAGCC GGCTACCCAA CGCTGTGCAA AGGTCGCTTC 
GACGTGCAGG GAGACACCTA TTACGCGCTG GAAGAACCGA CCAGCCTGAA CGTGCTGGAA 
ATACTGCCGG ACATCATCAA GATCGGGGTC AAGGCCATCA AGGTTGAAGG CCGGCAGCGT 
AGCCCGACTT ATGTTGCACA AGTCACCCGT ACGCTGCGTG CCGCGCTCGA TTCGCTCCGC 
GATGGCAGCG AACGCTTCCA CGTAAAACCA GCCTGGCAGG CGGAGCTGTC CAAGGTTTCC 
GAAGGCAGCC AGGCGACGCT CGGCGCCTAC AGCCGGCCAT GGCGCTAA

Protein sequence

MSSLPDLVCP AGSLPALKAA VDNGADTVYL GYKNDTNARN FAGLNFDTKT MAEGIRYAHA 
KGREVLMAIN TFPQTGRVAD WHKAVDGAVD QGVDAIILAD IGLLDYARQR HPQQRLHLSV 
QGSATSYEAI NFCQREFGIR RAVLPRVLTL AQVEHVIKNT TVEIEVFGFG SLCVMNEGRC 
WLSSYACGES PNTVGACSPA KYVKWDKKPG TMETRLNGVL IDRFGDDEPA GYPTLCKGRF 
DVQGDTYYAL EEPTSLNVLE ILPDIIKIGV KAIKVEGRQR SPTYVAQVTR TLRAALDSLR 
DGSERFHVKP AWQAELSKVS EGSQATLGAY SRPWR