Gene Dret_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2006
Symbol
ID	8419851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2303845
End bp	2304834
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	62%
IMG OID	645038594
Product	thiamine-monophosphate kinase
Protein accession	YP_003198868
Protein GI	258406126
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTTC GTTCCGAAGA CAGTTTTCTT GCCTTGATCG ACCGGTATTT TCCCAATACT 
CACGCCCATA TGCCATTGGG GCGCGGCGAT GATTGCGCGG TGCTGCGCGC GCCGGACTGG 
ATGTGCCTGA CCGCGGATAT GTTCGTGGAG GACGTCCACT TCCGGCGGAC CTACTTCAGT 
CCCGAAGACA TCGGATACAA GGCCCTGGCA GTGAATCTGT CTGATATCGC CGGCATGGGG 
GCCCGGCCGC TCGGCTTTGC CCTCAATTTG ATGGCCACAG GGCGGGAAAG CGATGAATTC 
TGCGAGGGGT TGGTCTCAGG TATGGCCGAT CTGGCGCGGG AGCATGATCT GCCCCTGGTC 
GGTGGGGATC TCAGCCGAGG ACCGGCTTTG GCGGTGGCTA TCACCATGTG GGGCAAGTCG 
CAGAAACGGT TTTTGCTGCG CCGCAATTGT CAGCCTGGCG ATCTGCTTTT TTGTCTCGGC 
GATGTCGGTC TGGCCCGCTG CGGGCTGTCC GTGCTCGAGC GCGATGATGA GTCGTTGCGC 
TGGCGTTTTC CGGAAGCCGT CGAGGCGCAT TTGCGGCCCC AGATCCGGTT GGAGCAGGCC 
CAGACTTTGG GCGAATTCGA GCAGGTGCGC GGGCTGATGG ACGTTTCGGA CGGCCTGATG 
CAGGACTTGC CCCGCTTTGT CGGGCCGGGC TTCGGCGTCG AGGTCTTCAT GAGCGAAAGT 
GAAGTCCACC CGGAGGTGGT CGAATTCGCA CGGGAGTTTG CGGGATTGCC GGGAGTGGAG 
CAGGCCCTTC TCGGCGGCGA GGACTACGCC CTGCTGGGTG CGGCGGCCCC GGGGGCGAGC 
CATTTTCTGG AGCGGGAGTT CCCGGAGATC CTGTGGTTGG GGAAAGTGGT CGAACGCTCC 
GGGATTTATC TCGACGGCGC CCGCCTGGAT CTCAAGGGTT TTGACCATTT CGGCGCCGAT 
TTCCCGGAAC ACAGTGAAGA CGGAGAGTAA

Protein sequence

MTLRSEDSFL ALIDRYFPNT HAHMPLGRGD DCAVLRAPDW MCLTADMFVE DVHFRRTYFS 
PEDIGYKALA VNLSDIAGMG ARPLGFALNL MATGRESDEF CEGLVSGMAD LAREHDLPLV 
GGDLSRGPAL AVAITMWGKS QKRFLLRRNC QPGDLLFCLG DVGLARCGLS VLERDDESLR 
WRFPEAVEAH LRPQIRLEQA QTLGEFEQVR GLMDVSDGLM QDLPRFVGPG FGVEVFMSES 
EVHPEVVEFA REFAGLPGVE QALLGGEDYA LLGAAAPGAS HFLEREFPEI LWLGKVVERS 
GIYLDGARLD LKGFDHFGAD FPEHSEDGE