Gene EcolC_3979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3979
Symbol
ID	6064516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4371166
End bp	4372203
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	53%
IMG OID	641603392
Product	tRNA-dihydrouridine synthase A
Protein accession	YP_001726907
Protein GI	170021953
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00742] tRNA dihydrouridine synthase A

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.16691
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGGTA ATTCTGAAAT GCAAAAAATC AACCAAACCA GCGCAATGCC TGAAAAAACT 
GACGTTCACT GGAGTGGTCG GTTTAGCGTT GCACCAATGC TCGACTGGAC GGACAGACAT 
TGCCGCTATT TCTTGCGTCT GCTTTCCCGC AATACGTTGC TGTATACCGA AATGGTGACC 
ACAGGGGCGA TTATTCACGG TAAAGGTGAT TACCTGGCGT ACAGTGAAGA AGAACATCCG 
GTAGCGTTGC AACTCGGCGG TAGCGATCCG GCGGCGCTGG CACAGTGTGC GAAGCTGGCA 
GAAGCGCGTG GATATGATGA GATCAACCTG AATGTCGGCT GCCCGTCTGA CCGGGTGCAG 
AACGGCATGT TTGGTGCGTG TCTGATGGGT AATGCGCAGC TGGTTGCCGA CTGCGTGAAA 
GCGATGCGCG ATGTGGTGTC GATTCCGGTG ACGGTGAAAA CGCGTATTGG CATCGACGAC 
CAGGACAGCT ATGAATTTCT CTGCGATTTC ATCAACACCG TTTCCGGCAA AGGCGAGTGT 
GAGATGTTCA TCATCCATGC ACGTAAAGCC TGGCTTTCGG GGTTAAGTCC GAAAGAAAAC 
CGTGAGATCC CGCCGCTCGA TTATCCGCGT GTGTATCAAC TGAAGCGTGA CTTTCCGCAT 
CTGACAATGT CGATTAACGG TGGTATCAAG TCGCTGGAAG AGGCCAAAGC ACACCTGCAA 
CATATGGATG GCGTGATGGT CGGGCGCGAG GCGTATCAGA ATCCGGGTAT TCTGGCGGCG 
GTAGACCGGG AGATCTTTGG TTCCTCGGAT ATCGATGCCG ATCCGGTGGC GGTAGTGCGC 
GCCATGTATC CGTACATTGA GCGTGAACTC AGCCAGGGGA CGTATCTCGG TCATATTACC 
CGGCATATGT TGGGCTTGTT CCAGGGTATT CCTGGCGCGC GGCAGTGGCG GCGTTATTTA 
AGTGAAAATG CCCATAAAGC GGGTGCAGAC ATTAATGTGC TGGAACACGC GCTCAAACTG 
GTGGCGGATA AGCGTTAA

Protein sequence

MHGNSEMQKI NQTSAMPEKT DVHWSGRFSV APMLDWTDRH CRYFLRLLSR NTLLYTEMVT 
TGAIIHGKGD YLAYSEEEHP VALQLGGSDP AALAQCAKLA EARGYDEINL NVGCPSDRVQ 
NGMFGACLMG NAQLVADCVK AMRDVVSIPV TVKTRIGIDD QDSYEFLCDF INTVSGKGEC 
EMFIIHARKA WLSGLSPKEN REIPPLDYPR VYQLKRDFPH LTMSINGGIK SLEEAKAHLQ 
HMDGVMVGRE AYQNPGILAA VDREIFGSSD IDADPVAVVR AMYPYIEREL SQGTYLGHIT 
RHMLGLFQGI PGARQWRRYL SENAHKAGAD INVLEHALKL VADKR