Gene Dret_0153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0153
Symbol
ID	8417957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	197120
End bp	198196
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	60%
IMG OID	645036718
Product	glucose-1-phosphate thymidylyltransferase
Protein accession	YP_003197033
Protein GI	258404291
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1209] dTDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01207] glucose-1-phosphate thymidylyltransferase, short form

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.34957
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAACT GCGCGGGACG CCAGTCTCAC CTCTCACGGT GCGCCTTGGT CCTGCAGGCA 
ATCAGCCGCT CCCACGAGAA AACACCGGAG CGCAGCCTCC TCTTGCCCTT CCCTGCCCTT 
CAAGCTAACA ACGCCCACGT CCTCACTGCG TCACTCGCTT CGGTATTGGA GAACGGAGTT 
TCCATGAAAG GCATCATTCT CGCCGGGGGA TCCGGCACAC GGCTGTATCC GTTGACCTGG 
GGCGTGAGCA AACAGCTTTT GCCCATCTAC GATAAACCCA TGATCTATTA TCCCCTTTCC 
GTGCTTATGC TCGCCGGTAT CAGGGAGATT CTGATCATTT CCACACCACA GGACATCCCC 
CGTTTCGAAC GGCTTCTGGG CAGCGGCGAA CAAATCGGGC TTCGCTTGAC GTATAAGACC 
CAGCCGGAGC CGGAAGGGTT GCCCCAGGCG TTTGTCCTCG GGCGGGAGTT TATCGGCGAC 
GACTCGGTCT GTCTCGTCCT GGGAGACAAT CTGCTTTACG GCGAAGGGCT CTCGCGGATC 
CTGCAGCGGT GTGCCGCCCT GGAACAAGGG GGGATCGTTT TCGGCTATCC AGTCCGGGAT 
CCGCGGCAGT ACGGCGTGGT GGAATTCGAC GCCCATGGGC GGGCCACGCG CATCGTCGAA 
AAACCGGAGA AGCCGCGGTC AAAATATGCG GTCCCCGGGA TCTATTTCTA TGACAATACT 
GTGACCGAGA TCGCCGCACA GTTGCGTCCC TCCTCACGCG GCGAACTGGA GATCACGGAC 
ATCAACACCG CCTATCTCCA GGCTGGCACA CTCCACGTCG AAGTCCTGGG CCGCGGGTAC 
GCCTGGCTTG ACGCCGGGAC CCATGAATCC CTGCACCAGG CCGCGAGCTT CGTCCAGGCT 
ATCCAGGAGC GCCAGGGATT CAAACTCGGC TGTATCGAGG AAATCGCCCT GCGCAAAGGA 
TACATCACGC CGGATCAGGT CCGTGAACTC GCCGCTCCCA TGGCCAAAAA CGATTACGGC 
GCCTACTTGC TCCAGCTTGT CGAGGAACTG CACACCTACG GACAACCGGC CTCCTGA

Protein sequence

MRNCAGRQSH LSRCALVLQA ISRSHEKTPE RSLLLPFPAL QANNAHVLTA SLASVLENGV 
SMKGIILAGG SGTRLYPLTW GVSKQLLPIY DKPMIYYPLS VLMLAGIREI LIISTPQDIP 
RFERLLGSGE QIGLRLTYKT QPEPEGLPQA FVLGREFIGD DSVCLVLGDN LLYGEGLSRI 
LQRCAALEQG GIVFGYPVRD PRQYGVVEFD AHGRATRIVE KPEKPRSKYA VPGIYFYDNT 
VTEIAAQLRP SSRGELEITD INTAYLQAGT LHVEVLGRGY AWLDAGTHES LHQAASFVQA 
IQERQGFKLG CIEEIALRKG YITPDQVREL AAPMAKNDYG AYLLQLVEEL HTYGQPAS