Gene EcHS_A4290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4290
Symbol	dusA
ID	5595435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4293407
End bp	4294450
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	53%
IMG OID	640923392
Product	tRNA-dihydrouridine synthase A
Protein accession	YP_001460837
Protein GI	157163519
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00742] tRNA dihydrouridine synthase A

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAATGC ACGGTAATTC TGAAATGCAA AAAATCAACC AAACCAGCGC AATGCCTGAA 
AAAACTGACG TTCACTGGAG TGGTCGGTTT AGCGTTGCAC CAATGCTCGA CTGGACGGAC 
AGACATTGCC GCTATTTCTT GCGTCTGCTT TCCCGCAATA CGTTGCTTTA TACCGAAATG 
GTGACCACAG GGGCGATTAT TCACGGTAAA GGTGATTATC TGGCGTACAG TGAAGAAGAA 
CATCCGGTAG CGTTGCAACT GGGCGGTAGC GATCCGGCGG CGCTGGCGCA GTGTGCAAAG 
CTGGCAGAAG CGCGCGGATA TGATGAGATC AACCTGAATG TCGGCTGCCC GTCTGACCGG 
GTGCAGAACG GCATGTTTGG TGCGTGTCTG ATGGGTAATG CGCAGCTGGT TGCCGACTGC 
GTGAAAGCGA TGCGCGATGT GGTGTCGATT CCGGTGACGG TGAAAACGCG TATTGGCATC 
GACGACCAGG ACAGCTATGA ATTTCTCTGC GATTTCATCA ATACCGTTTC CGGCAAAGGC 
GAGTGTGAGA TGTTCATCAT CCACGCACGT AAAGCCTGGC TTTCGGGGTT AAGCCCGAAA 
GAAAACCGTG AAATCCCGCC GCTCGATTAT CCGCGTGTGT ATCAACTGAA GCGTGACTTT 
CCGCATCTGA CAATGTCGAT TAACGGTGGT ATCAAGTCGC TGGAAGAGGC CAAAGCACAC 
CTGCAACATA TGGATGGCGT GATGGTCGGG CGCGAGGCGT ATCAGAATCC GGGTATTCTG 
GCGGCGGTAG ACCGGGAGAT CTTTGGTTCC TCGGATACCG ATGCCGATCC GGTGGCGGTA 
GTGCGCGCCA TGTATCCGTA CATTGAGCGT GAACTCAGCC AGGGGACGTA TCTCGGCCAT 
ATTACCCGGC ATATGCTGGG TTTGTTCCAG GGTATTCCTG GCGCGCGGCA GTGGCGGCGT 
TATTTAAGTG AAAATGCCCA TAAAGCGGGT GCTGACATTA ACGTGCTGGA ACACGCGCTC 
AAACTGGTGG CGGATAAGCG TTAA

Protein sequence

MKMHGNSEMQ KINQTSAMPE KTDVHWSGRF SVAPMLDWTD RHCRYFLRLL SRNTLLYTEM 
VTTGAIIHGK GDYLAYSEEE HPVALQLGGS DPAALAQCAK LAEARGYDEI NLNVGCPSDR 
VQNGMFGACL MGNAQLVADC VKAMRDVVSI PVTVKTRIGI DDQDSYEFLC DFINTVSGKG 
ECEMFIIHAR KAWLSGLSPK ENREIPPLDY PRVYQLKRDF PHLTMSINGG IKSLEEAKAH 
LQHMDGVMVG REAYQNPGIL AAVDREIFGS SDTDADPVAV VRAMYPYIER ELSQGTYLGH 
ITRHMLGLFQ GIPGARQWRR YLSENAHKAG ADINVLEHAL KLVADKR