Gene Daro_3820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3820
Symbol
ID	3567976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4103332
End bp	4104837
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	62%
IMG OID	637682294
Product	methane/phenol/toluene hydroxylase:YHS
Protein accession	YP_287018
Protein GI	71909431
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	0.898066
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0706856
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTGC TTAATAGAAT GGACTGGTAC GACCTGGCCA GGACTACCAA CTGGACGCCC 
AAGTACGTGA CCGAAGATGA ACTCTTCCCG CCACTGTTGG CAGGGGATTT CGGTCTGCCG 
CAAAACGCCT GGGAAAAATA CGACGAGCCG TACAAGCAGA CCTACCCGGA ATACGTGAAG 
GTCCAGCGCG ACAAGGATGC CGGTGCCTAC TCGGTGAAAG CTGCGCTGGA GCGTAGCCGG 
ATTTACGAAA ATGCCGATCC GGGCTGGAAG TCGGTCATGA AGGCCCACTA CGGCGCCATC 
GCCCGCGGCG AATATGCCGC GGCCAGTGCC GAGGCCCGCA TGATGCGCTT CTCCAAGGCG 
CCGGGCATGC GCAACATGTC GACGCTGGGT TGTCTGGATG AAATCCGCCA CGGCCAGATG 
CAGCTCTACT TCCCGCACGA GCACGTCTCC AAGGATCGTC AGATGGACTG GGCCTTCAAG 
GCCTACGACA CCAACGAGTG GGCGATGATC GCGGCCCGTC ACTTCTTCGA CGACATCATG 
ATGACCCGCG ACGCGATCAG CGTCTCGATC ATGTTGACCT TCAGCTTCGA AACCGGCTTC 
ACCAACATGC AGTTCCTCGG CCTGGCGGCC GATGCCGCCG AAGCGGGCGA TCACACCTTT 
GCCAACCTGA TCTCCAGCAT CCAGACCGAC GAGTCGCGTC ATGCCCAGAT CGGCGGCCCG 
GCGCTGAAGG TGCTGATCGA GAACGGCCAC AAGGCCGAGG CGCAGAAGCG CGTCGACATC 
GCCGTCTGGG GCGCCTGGAA GCTGTTCTCG GTGCTGACCG GTCCGATCAT GGATTACTAC 
ACCCCGCTCG AGCACCGCAA GCAGTCGTTC AAGGAATTCA TGGAGGAATG GATCGTTGCC 
CAGTTCGAGC GCGCCCTGAC CGACATGGGC CTCGATTTGC CCTGGTACTG GGACATCTTC 
CTGAAGGACA TCGCCCAGAC CCACCACGGC ATGCACCTCG GCTCCTATTT CTGGCGCCCG 
ACCCTGTGGT GGAACCCGGC CGCCGGCGTG ACGCCGGACG AGCGGGCCTG GCTGGAAGAG 
AAGTATCCCG GCTGGAACGA TACCTGGGGT CAGTGCTGGG ATGTGTTCAT CGACAACGTG 
GTCGACGGCA ACATGGCCAT GACCTATCCG GAAACCCTGC CTTACGTCTG CAACATGTGT 
CAGCTGCCGA TCCTCGGCAC GCCGGGCAAG GGCTGGAACG TCAAGGACTA CCCGCTCGAA 
TACAACGGTC GCCTCTATCA CTTCGGTTCC GAAGTCGACC GCTGGGTCTT CGAGCAGGAG 
CCGGAACGCT ACGCCGGCCA CCTGTCCATC GTCGACCGTT TCCTGGCCGG GATGATCCAG 
CCGATGGATC TGGGCGGGGC GCTGCAGTAC ATGAACTTGG CGCCCGGCGA GATCGGCGAC 
GACGCCCACA ACTATGCCTG GGCCGAAGTG TACCGGGCCA TGCGGGCTGC CAAGAAGGCT 
GGCTGA

Protein sequence

MAVLNRMDWY DLARTTNWTP KYVTEDELFP PLLAGDFGLP QNAWEKYDEP YKQTYPEYVK 
VQRDKDAGAY SVKAALERSR IYENADPGWK SVMKAHYGAI ARGEYAAASA EARMMRFSKA 
PGMRNMSTLG CLDEIRHGQM QLYFPHEHVS KDRQMDWAFK AYDTNEWAMI AARHFFDDIM 
MTRDAISVSI MLTFSFETGF TNMQFLGLAA DAAEAGDHTF ANLISSIQTD ESRHAQIGGP 
ALKVLIENGH KAEAQKRVDI AVWGAWKLFS VLTGPIMDYY TPLEHRKQSF KEFMEEWIVA 
QFERALTDMG LDLPWYWDIF LKDIAQTHHG MHLGSYFWRP TLWWNPAAGV TPDERAWLEE 
KYPGWNDTWG QCWDVFIDNV VDGNMAMTYP ETLPYVCNMC QLPILGTPGK GWNVKDYPLE 
YNGRLYHFGS EVDRWVFEQE PERYAGHLSI VDRFLAGMIQ PMDLGGALQY MNLAPGEIGD 
DAHNYAWAEV YRAMRAAKKA G