Gene ECH74115_5551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5551
Symbol	dusA
ID	6968138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	5190024
End bp	5191061
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	53%
IMG OID	643389192
Product	tRNA-dihydrouridine synthase A
Protein accession	YP_002273589
Protein GI	209398005
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00742] tRNA dihydrouridine synthase A

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGATA ATCATGAAGC ACAAAAAATT AATCAAACCA GCGTGATGCC TGAAAAAACT 
GGTGTTTACT GGAATTCTCG GTTTAGCGTT GCACCAATGC TCGACTGGAC GGACAGACAT 
TGCCGCTATT TCTTGCGTCT GCTTTCCCGC AATACGTTGC TGTATACCGA AATGGTGACT 
ACAGGGGCGA TTATTCACGG TAAAGGTGAT TACCTGGCGT ACAGTGAAGA AGAACATCCG 
GTAGCGTTGC AACTCGGCGG TAGCGATCCG GCGGCGCTGG CGCAGTGTGC GAAGCTGGCA 
GAAGCGCGTG GATATGATGA GATCAACCTG AATGTCGGCT GCCCGTCTGA CCGGGTGCAG 
AACGGCATGT TTGGTGCGTG TCTGATGGGT AATGCGCAGC TGGTTGCCGA CTGCGTGAAA 
GCGATGCGCG ATGTGGTGTC GATTCCGGTG ACGGTGAAAA CGCGTATTGG CATCGATGAC 
CAGGACAGCT ATGAATTTCT CTGCGATTTC ATCAACACCG TTTCCGGCAA AGGCGAGTGT 
GAGATGTTCA TCATCCACGC ACGTAAAGCC TGGCTTTCGG GGTTAAGCCC GAAAGAAAAC 
CGTGAAATCC CGCCGCTCGA TTATCCGCGT GTGTATCAAC TGAAGCGTGA CTTTCTGCAT 
CTGACGATGT CGATTAACGG TGGTATCAAG TCGCTGGAAG AGGCTAAAGC GCATTTGCAA 
CATATGGATG GCGTGATGGT CGGGCGCGAA GCGTATCAGA ATCCGGGTAT TCTGGCGGCG 
GTAGACCGAG AGATCTTTGG TTCCTCGGAT ACCGATGCCG ATCCGGTGGC GGTAGTGCGC 
GCCATGTATC CGTACATTGA GCGTGAACTC AGCCAGGGGA CGTATCTTGG CCATATTACC 
CGGCATATGT TGGGCTTGTT CCAGGGTATT CCTGGCGCGC GGCAGTGGCG GCGTTATTTA 
AGTGAAAATG CCCATAAAGC GGGTGCAGAC ATTAACGTGC TGGAACACGC GCTCAAACTG 
GTGGCGGATA AGCGTTAA

Protein sequence

MHDNHEAQKI NQTSVMPEKT GVYWNSRFSV APMLDWTDRH CRYFLRLLSR NTLLYTEMVT 
TGAIIHGKGD YLAYSEEEHP VALQLGGSDP AALAQCAKLA EARGYDEINL NVGCPSDRVQ 
NGMFGACLMG NAQLVADCVK AMRDVVSIPV TVKTRIGIDD QDSYEFLCDF INTVSGKGEC 
EMFIIHARKA WLSGLSPKEN REIPPLDYPR VYQLKRDFLH LTMSINGGIK SLEEAKAHLQ 
HMDGVMVGRE AYQNPGILAA VDREIFGSSD TDADPVAVVR AMYPYIEREL SQGTYLGHIT 
RHMLGLFQGI PGARQWRRYL SENAHKAGAD INVLEHALKL VADKR