Gene Daro_3794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3794
Symbol
ID	3567950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4078821
End bp	4080374
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	60%
IMG OID	637682269
Product	methane/phenol/toluene hydroxylase:YHS
Protein accession	YP_286993
Protein GI	71909406
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.00765464
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00329078
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACATGA AAGCCAACAA GAAAAAGCTG GGCCTGAAGG AAAAGTACGC CCACATGACA 
CGCGGCCTGG ATTGGGAAAC CACCTACCAG CCGAAGGACA AGGTATTTCC GCAAGCCACC 
TTCGAGGGCA TCAAGGTGCA CGACTGGGAC AAGTGGGAAG ACCCCTTCCG CCTGACCATG 
GATGCCTACT GGAAATACCA GGCTGAAAAG GAGCGCAAGC TGTACGCCGT GCTCGACGCC 
TTCGCCCAGA ACAACGGCCA CCTCGGGATT ACCGATGCGC GCTATCTGAG TGCCGTCAAA 
CTGTTCCTGA CCGGCATTTC GCCGCTGGAG TATATGGCCC ACCGTGGTTT CGCTGCAGCC 
GGCCGTAATT TCCCCGGCGT TGGTCCCCGC GTTGCCTGCC TGATGCAGTC GATCGACGAA 
GTGCGTCATG CCCAGACCCA GATCCACGCC CTGTCGAACT ACAACAAGTT CTACGAAGGC 
TTCCATGCCG GCGCAAGCCA CCAGATCGAA CGCCTCTGGT ACCTGTCGGT GCCCAAGTCC 
TTCTTCGACG ACGCCTTCAG TGCCGGCCCC TTCGAATGGA TGATCGCCAT CGGCTTCTCC 
TTCGAATACG TGCTGACCAA CCTGTTGTTC GTGCCCTTCA TGTCCGGTGC TGCCTACAAC 
GGCGACATGG CGACCGTGAC CTTCGGTTTC TCGGCGCAAT CCGACGAAGC CCGCCACATG 
ACGCTGGGCC TCGAGTGCAT CAAGTTCATG CTCGAACAGG ATCCGGACAA CCTGCCCATC 
GTCCAGAAGT GGATCGACAA GTGGGCCTGG CGCGGTATCC GCGTGTTGAG CCTGGTCTCC 
ACGATGATGG ACTACATGCT GCCGAAGCGC GTGATGAGCT GGAAGGAAGC CTGGGAAATC 
TACTTCGAGC AGAACGGCGG CGCGCTGTTC AACGATCTGG CCAAGTACGG CATCAAGGTC 
CCGGACTGCA TCGCCCAATG CACCGTCGAC AAGGAGCATC AGTCGCACCA GCTGTGGCTG 
ACCTTGTGCA CCCACTCGCA TGCGATGGGC CTGCACACCT GGCTGCCCGA TGCCGACGAG 
ATGGACTGGT TGTCGGCGAA ATACCCGAAC ACCTTCGACA AGTACTACCG TCCGCGTTTC 
GACGAGCTGC GCGAACGTGC CGACAAGGGC GAGCGCTTCT TCGCCAACAC GCTGCCCATG 
CTGTGCCAGG TCTGCCAGAT TCCGATGCTC TTCACCGAGC CGGACGACCC GACCAAGATC 
TGCTATCGCG AGTCGGAGTT CCAGGGCGAG AAGTACCACA CCTGCTCGGA TGGCTGTAAG 
CACATCTTTG ACGACGAGCC GGAGAAGTAC ATCCAGGCCT GGTTGCCGGT ATATCAGCTT 
TATCAGGGCA ATTGCTGGCC GGAGGGCACT GATCCGACGG CCGAAGGATT CAATCCGGTG 
GCCAAGTATC TCGAATGGTG CCACATCGAT GCCAAGGACA CCGGCGATTA CGAAGGCTCC 
GGTGACCAGG CGAACTTTGC TGCCTGGCGT GGCGCGGCCA CCCAGAACAC CTGA

Protein sequence

MDMKANKKKL GLKEKYAHMT RGLDWETTYQ PKDKVFPQAT FEGIKVHDWD KWEDPFRLTM 
DAYWKYQAEK ERKLYAVLDA FAQNNGHLGI TDARYLSAVK LFLTGISPLE YMAHRGFAAA 
GRNFPGVGPR VACLMQSIDE VRHAQTQIHA LSNYNKFYEG FHAGASHQIE RLWYLSVPKS 
FFDDAFSAGP FEWMIAIGFS FEYVLTNLLF VPFMSGAAYN GDMATVTFGF SAQSDEARHM 
TLGLECIKFM LEQDPDNLPI VQKWIDKWAW RGIRVLSLVS TMMDYMLPKR VMSWKEAWEI 
YFEQNGGALF NDLAKYGIKV PDCIAQCTVD KEHQSHQLWL TLCTHSHAMG LHTWLPDADE 
MDWLSAKYPN TFDKYYRPRF DELRERADKG ERFFANTLPM LCQVCQIPML FTEPDDPTKI 
CYRESEFQGE KYHTCSDGCK HIFDDEPEKY IQAWLPVYQL YQGNCWPEGT DPTAEGFNPV 
AKYLEWCHID AKDTGDYEGS GDQANFAAWR GAATQNT