Gene Dret_1079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1079
Symbol
ID	8418904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1270692
End bp	1271678
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	63%
IMG OID	645037651
Product	dihydrouridine synthase DuS
Protein accession	YP_003197945
Protein GI	258405203
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.224362
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.224142
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAACG TTTCTGCGAC GGGGCCCTCC CCGCTCCCCT TCGGGCCCCA GGCTCCGTGG 
CTGGCGCCGT TGGCCGGATT CACCGACCTG CCGTTTCGGC TCCTGTGCCG TGAAAACGGT 
GCTCGTGTGG CCCACACAGA AATGATCAGC GTCAAAGGGC TGATATACAA CAGTCAGGGC 
ACCTGGGACC TCCTGGCTAC CGCCCCCGCC GACACGCCCC TGGTGGTCCA ATTGTTCGGT 
GCAGATCCCG ACTGTTTTGC GCAGCCGGTG CGCTGGCTCA CTGAACGGGG ATTTCACTGG 
ATCGACCTCA ATGCGGGATG TCCGGTGCGC AAGGTGATCA AGACCGGGGC CGGCGCCGCG 
CTTATGGAAG ACCCGCAGCG CCTTGTACGC ATCATGCAGA CCATTGGCAG GGCCGCCCCG 
GTGCAGGCCG GGGTCAAACT CCGCCTCCCA GCGGACGGTA GCACAGACGG GTTACTCCGG 
TTACGCGACA CTCTCGCACG TGCCGGGGTC AGTTGGATCA CCTTGCACCC GCGCACGGCC 
AGACAGGGAT ATGGAGGATT GGCGCAGTGG AGTGCCTTGT CGCGAATGGC CGAGTCCAGC 
CCGGTACCCA TCGTGGCCAG CGGCGATCTG TGGAACGCGC AAGCGGCCCG GCGATGCTTT 
GAGCAAACCG GTGTGGATGG GATCATGTTC GCCCGTGGCG CCCTGCACAA TCCCCGGATC 
TTCAAAGCTG ACCTCGCGAC TGGAGCCGAG GAAGATCCCT GTACCGACAC GGCTTCAATA 
GCCGCTCTGG TTCGACGACA CGGCCAATTG TGCCGCCGCT ATGATCCCAG CCGGAGCATG 
CTGCTGAAGA TGCGCTCATT TATCCCGCGC TACGTCAAGG GATTTCCCGG CGCCAAACAG 
GCCCGGAAGG GAATTATCGC CTGCCAGGAT TGGGAGGCCT TTGAACAATA TGCCGATCAA 
CTTGAAGAGG CCTTGGCCGG ACAATGA

Protein sequence

MTNVSATGPS PLPFGPQAPW LAPLAGFTDL PFRLLCRENG ARVAHTEMIS VKGLIYNSQG 
TWDLLATAPA DTPLVVQLFG ADPDCFAQPV RWLTERGFHW IDLNAGCPVR KVIKTGAGAA 
LMEDPQRLVR IMQTIGRAAP VQAGVKLRLP ADGSTDGLLR LRDTLARAGV SWITLHPRTA 
RQGYGGLAQW SALSRMAESS PVPIVASGDL WNAQAARRCF EQTGVDGIMF ARGALHNPRI 
FKADLATGAE EDPCTDTASI AALVRRHGQL CRRYDPSRSM LLKMRSFIPR YVKGFPGAKQ 
ARKGIIACQD WEAFEQYADQ LEEALAGQ