Gene Daro_3665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3665
Symbol
ID	3567607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3939779
End bp	3940792
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	61%
IMG OID	637682138
Product	dihydrouridine synthase TIM-barrel protein nifR3
Protein accession	YP_286864
Protein GI	71909277
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTTG TCGGTTTCCA GCTTCGCAAC AACCTGTTCG TCGCCCCCAT GGCCGGCGTG 
ACGGATCGTC CTTTCCGCCA GTTGTGCAAG AAGATGGGGG CTGGCCTGGC CGTGTCCGAA 
ATGGTCACCT CCAATTCATT GCTTTATGGC AGCGCCAAGA CGCTGCGCCG GGCCAATCAC 
GAAGGTGAGG TCGCCCCGAT CTCGGTGCAG ATCGCCGGCG CCGATCCGAA AATGATGGCC 
GAGGCGGCCA AACACAACGT CGACAACGGC GCCCAGATCA TCGACATCAA CATGGGTTGC 
CCGGCCAAGA AGGTCTGCAA CGTGATGGCC GGCTCGGCGC TGATGCAGGA CGAGCAGCAG 
GTCGGACGCA TTCTCGATGC CGTCGTTGCT GCAATCCCGA ACACCCCGGT CACGCTGAAA 
TTCCGTACCG GCTGGAATCT GGCCAACAAG AACGCCCCGA CCATCGCGCG CATCGCCGAA 
TCGGCGGGCA TCCGTGCCGT CGCCATCCAC GGCCGGACGC GCTGCCAGCA ATACACCGGC 
GAGGCGGAAT ACGACACCAT CGCCATGGTC AAGACGCTGA TCAGCATCCC GGTCATCGCC 
AACGGCGACA TCACGACCCC GGAAAAGGCC AAGCACGTGC TCGACGTGAC CGGCGCCGAT 
GGCGTCATGA TCGGCCGCGC CGCCCAGGGT CGCCCCTGGC TGTTCCGCGA GATCGAACAC 
TATCTAAAAA CCGGCGAGCA CCTGCCACCG GCCGAGGTCA TGGAGATTCA CAGCATCCTG 
CTGGAGCATC TCGAAGACCT TTACGCTTTC TACGGCCCGG AAACGGGGTT CAAGGTCGCC 
CGCAAGCACA TCTCCTGGTA CACCAAGGGG TTGGTTGGCT CGGCGGCCTT CCGCAAGGAA 
ATGAACGTCC TGCCCAGCAT CGATCAACAG ATGCAGGCAG TGAACGACTT CTTCAGCCGA 
CTGGCGGCTG AGCATCAGCA TTTGAAATAC ACAGAGGAGG CGTTGGCAGC ATGA

Protein sequence

MDFVGFQLRN NLFVAPMAGV TDRPFRQLCK KMGAGLAVSE MVTSNSLLYG SAKTLRRANH 
EGEVAPISVQ IAGADPKMMA EAAKHNVDNG AQIIDINMGC PAKKVCNVMA GSALMQDEQQ 
VGRILDAVVA AIPNTPVTLK FRTGWNLANK NAPTIARIAE SAGIRAVAIH GRTRCQQYTG 
EAEYDTIAMV KTLISIPVIA NGDITTPEKA KHVLDVTGAD GVMIGRAAQG RPWLFREIEH 
YLKTGEHLPP AEVMEIHSIL LEHLEDLYAF YGPETGFKVA RKHISWYTKG LVGSAAFRKE 
MNVLPSIDQQ MQAVNDFFSR LAAEHQHLKY TEEALAA