Gene EcSMS35_3555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3555
Symbol	dusB
ID	6146960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3637680
End bp	3638645
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	52%
IMG OID	641618384
Product	tRNA-dihydrouridine synthase B
Protein accession	YP_001745531
Protein GI	170680881
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000446962
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG GACAATATCA GCTCAGAAAT CGCCTGATCG CAGCGCCCAT GGCTGGCATT 
ACAGACAGAC CTTTTCGGAC GTTGTGCTAC GAGATGGGAG CCGGATTGAC AGTATCCGAG 
ATGATGTCTT CTAACCCACA GGTTTGGGAA AGCGACAAAT CTCGTTTACG GATGGTGCAC 
ATTGATGAAC CCGGTATTCG CACCGTGCAA ATTGCTGGTA GCGATCCGAA AGAAATGGCA 
GATGCAGCAC GTATTAACGT GGAAAGCGGT GCCCAGATTA TTGATATCAA TATGGGTTGC 
CCGGCTAAAA AAGTGAATCG CAAGCTCGCA GGTTCAGCCC TTTTGCAGTA CCCGGATGTC 
GTTAAATCGA TCCTTACCGA GGTCGTCAAT GCAGTGGACG TTCCTGTTAC CCTGAAGATT 
CGCACCGGCT GGGCGCCGGA ACACCGTAAC TGCGAAGAGA TTGCCCAACT GGCTGAAGAC 
TGTGGCATTC AGGCTCTGAC CATTCATGGC CGTACACGCG CCTGTTTGTT CAATGGAGAA 
GCTGAGTACG ACAGTATTCG GGCAGTTAAG CAGAAAGTTT CCATTCCGGT TATCGCGAAT 
GGCGACATTA CTGACCCGCT TAAAGCCAGA GCTGTGCTCG ACTATACAGG GGCCGATGCC 
CTGATGATAG GCCGCGCAGC TCAGGGAAGA CCCTGGATCT TTCGGGAAAT CCAGCATTAT 
CTGGACACTG GGGAGTTGCT GCCCCCGCTG CCTTTGGCAG AGGTTAAGCG CTTGCTTTGC 
GCGCACGTTC GGGAACTGCA TGACTTTTAT GGTCCGGCAA AAGGGTACCG AATTGCACGT 
AAACACGTTT CCTGGTATCT CCAGGAACAC GCTCCAAATG ACCAGTTTCG GCGCACATTC 
AACGCCATTG AGGATGCCAG CGAACAGCTG GAGGCGTTGG AGGCATACTT CGAAAATTTT 
GCGTAA

Protein sequence

MRIGQYQLRN RLIAAPMAGI TDRPFRTLCY EMGAGLTVSE MMSSNPQVWE SDKSRLRMVH 
IDEPGIRTVQ IAGSDPKEMA DAARINVESG AQIIDINMGC PAKKVNRKLA GSALLQYPDV 
VKSILTEVVN AVDVPVTLKI RTGWAPEHRN CEEIAQLAED CGIQALTIHG RTRACLFNGE 
AEYDSIRAVK QKVSIPVIAN GDITDPLKAR AVLDYTGADA LMIGRAAQGR PWIFREIQHY 
LDTGELLPPL PLAEVKRLLC AHVRELHDFY GPAKGYRIAR KHVSWYLQEH APNDQFRRTF 
NAIEDASEQL EALEAYFENF A