Gene Dret_0483 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0483
Symbol
ID	8418289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	588318
End bp	589343
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	63%
IMG OID	645037045
Product	dihydrouridine synthase DuS
Protein accession	YP_003197358
Protein GI	258404616
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.322917
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCCA CACCGCTTGC TCCTTTGGAT CAGCCACTCG CTATAGGGGA CAAGTCCCTT 
ACAAACCGAT TCCTCCTCTC GCCTATGGTC GGGGTGACCC ATGTGGCCCT GCGCCGGCTG 
CTCCACGACT TTGGGGGATT CGGACTGCAT TGGACGGAAA TGTGTTCCGC TTCAGCTGTG 
CTCCAGGAGG ATCCCCGCAT CTCCCCGGTC TTCCGTTTCC ACCGCGATGA ACTTGCTACC 
CTGGTCTGCC AGATCATGGG CAGCGAGCCC GAGACCATGG CCGCTGCAGC ACGCCGGATA 
CAAGACGAGG GCTTTTTCGG TGTCGACATC AATATGGGCT GTTGCGTGGC CGCAGTCCGT 
CAACAAGGGG CTGGAGCGGC CCTGCTGCGC GATATTTCCC GGGCGGCGGC GATAGTCGAT 
GCCGTGCGTC AGGCCGTGGA CATCCCCCTC TTTGTCAAGC TCCGTAGCGG CTGGACTGAC 
CAGGGGCCGG TCGTCGTCCA CGCGGCCCGA GCGTGTGCCA AGGCCGGAGC CGACGCCTTG 
ATCGTGCACC CCCGCCTGGC CCCGGACCGC CGCACCCGGC CGCCCCAATG GAGAGACATC 
CGGGCTGTCT GTGAGGCGGT GGATCTCCCT GTTTTCGGCA ACGGCAACGT TTTCACTGCT 
GACGACGCAA CAGCCATGCT CCGCCAAACT GGCTGCCAGG GCATCGCCCT GGGCCGCATG 
GCCGCGGCTC GTCCCTGGAT CGCCGCCGAG TGGCTCGGCC ATTTTCATCC TGCCCCTGAA 
ACCTATCCGA AAGTGGCCCA ACGCATGGTC GAGCTCCTGT GGACGTCATT TCCCGAGGGG 
CAAGCCCTGC GATTGTACCG CAAATTCATG AATTATTTCG CGGCGAACTT TGCTTTCGGG 
CACCGGCTGC GCAGCGACTT GACCCGCTCC GCAACCCCGG AGGATCTTTA CAAGGAGATC 
GCACACCACC TGACGCCGCT GCCGCAGCTC ACACTGCGCC CCAACAGCCT GCTGTTTGCC 
GCGTGA

Protein sequence

MSATPLAPLD QPLAIGDKSL TNRFLLSPMV GVTHVALRRL LHDFGGFGLH WTEMCSASAV 
LQEDPRISPV FRFHRDELAT LVCQIMGSEP ETMAAAARRI QDEGFFGVDI NMGCCVAAVR 
QQGAGAALLR DISRAAAIVD AVRQAVDIPL FVKLRSGWTD QGPVVVHAAR ACAKAGADAL 
IVHPRLAPDR RTRPPQWRDI RAVCEAVDLP VFGNGNVFTA DDATAMLRQT GCQGIALGRM 
AAARPWIAAE WLGHFHPAPE TYPKVAQRMV ELLWTSFPEG QALRLYRKFM NYFAANFAFG 
HRLRSDLTRS ATPEDLYKEI AHHLTPLPQL TLRPNSLLFA A