Gene Emin_1472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1472
Symbol
ID	6263916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1569019
End bp	1569975
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	42%
IMG OID	642611957
Product	dihydrouridine synthase DuS
Protein accession	YP_001876357
Protein GI	187251875
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCTT TCGTTAAAAA AATAACAATA GGTTCTTTCG CGGCAAAAAA TAACCTTATG 
CTTGCCCCGA TGGCCGGTAT TACCGACACG CCTTTTAGAA TACACTGTTT AAATAACGGC 
GCGGGCATAG TTTGCGCGGA AATGGTGTCG GCCAAGGCGG TTGAGTATGA TAATAAAAAA 
AGCGTAAAAA TGTTAGCGGT TGATAAAAAG GAGCATCCAG TTTCCATGCA GATTTTCGGA 
GGGGATGCGG AAAGCATTTC CATAGCGGCC AAAGCGGCCG AGGCCGCGGG CGCTGATATT 
ATTGATATTA ACGCGGGGTG TCCCGTAAAA AAAATAAACA GAGCGGGCGC GGGCTGCGTT 
TTAATTAAAG ATGAAAAATT GTTAGCTTCA ATAGTAAACG CCGCTGTTAA TTCCGTGAGT 
ATTCCGGTAA CTTTAAAAAC AAGAATAGGT CTTACCGCTG GCGATTTTAA AGGTGATAAA 
ATTGCCAAAC TGGCTGAAAA CGAAGGCGCG GCGGCTGTTA TTATGCATGC GCGTTACGCC 
GGCAATGTGC ATGGCGGCCC GGCTGATTTA GAGGCTCTTG CCAAAGTCGT TTCGGCCGTT 
AAAATACCCG TTATAGGTAA CGGAGGTATC GTTGATGTTA ATACAGCTGA TAAAATGTTT 
GAAACCGGCG TGCGCGGCAT AATGGTGGGG CGCGGAGCTA TAGGCAATAT TAATATTTTT 
AAAAGCATAA TTAACGGTTG TGACATAGAG TTAAATCCTA AAGAAAACGT TAAAATATTT 
TTTAATCTGA TTAAACAAAA CGTTAATTTT TACGGTGAGA AAAACGGTAT TGCCAGGAGT 
AGGAAAACCG TGGGTTTTTG GATAAAAGGG TTTCCGATGG CGGGGGAAAT AAGAGGCGAG 
TTTGTAAAAT TAAATACATT AGCCGCAGTG CAAAAACTTT TTGGGGAATA TTTATGA

Protein sequence

MNAFVKKITI GSFAAKNNLM LAPMAGITDT PFRIHCLNNG AGIVCAEMVS AKAVEYDNKK 
SVKMLAVDKK EHPVSMQIFG GDAESISIAA KAAEAAGADI IDINAGCPVK KINRAGAGCV 
LIKDEKLLAS IVNAAVNSVS IPVTLKTRIG LTAGDFKGDK IAKLAENEGA AAVIMHARYA 
GNVHGGPADL EALAKVVSAV KIPVIGNGGI VDVNTADKMF ETGVRGIMVG RGAIGNINIF 
KSIINGCDIE LNPKENVKIF FNLIKQNVNF YGEKNGIARS RKTVGFWIKG FPMAGEIRGE 
FVKLNTLAAV QKLFGEYL