Gene Dred_2150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dred_2150
Symbol	thiH
ID	4958309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum reducens MI-1
Kingdom	Bacteria
Replicon accession	NC_009253
Strand	-
Start bp	2354833
End bp	2356302
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	43%
IMG OID	640181326
Product	thiamine biosynthesis protein ThiH
Protein accession	YP_001113492
Protein GI	134299996
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR02351] thiazole biosynthesis protein ThiH

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAATAA ATAAGGCTGA AATTTATAAT AACCAATGGG AACCGGCAGA TTTTATTAAT 
GAGGAAGAAA TCAACCGTTT ATTGGAAGAA GGCAAAAAGA CTTCTCCTGC TAGAGTGCGG 
GAAATCATTG AGAAGGCCAG AGAGGCCCGG GGGCTAACAC CAGAAGAAGT GGCTATTTTA 
CTGCAAAATG ATGACCAAGA TTTAATTAAT TTCATGTTTC AGGTTGCTAG CGAAATAAAG 
CTTAAAATCT ATGGTAAGCG CTTGGTCTTG TTTGCTCCTT TATATGTTAG CGACCACTGT 
GTAAATAACT GCGTTTATTG TGGTTACCGT TGTGATAACA AATTTAATCG TCGTAAGCTG 
ACCCAGGCAG AGGTGGAAGA GGAAATCAAG ATTTTAGAAT CCCTAGGTCA CAAGAGATTG 
GCAGTGGAGG CCGGGGAACA TCCAGGTGAA TGTCCCATCG AGTATGTTTT GGAGTGTTTA 
AAAACCATCT ACAGCATTAA GTTTGACAAC GGTAGTATTC GTCGTTGCAA CGTAAATATT 
GCGGCCACCA CCATTGAGGA ATACAAAATG TTAAAGGATG CTGGTATTGG AACCTATATT 
TTGTTCCAGG AAACCTATCA TAGGGAAACC TATAAGAAAA TGCATCCCAG TGGGCCCAAA 
GCAGATTACG ACTGGCATAC CACTGCCCAT GACCGGGCTA TGATGGCTGG TATTGATGAT 
GTAGGGCTTG GTCCTCTGTT TGGTCTTTAT GATTATAAAT ATGAAGTGAT GGGTCTTATG 
TTCCACGCCC TTCATATGGA AGAACGTTTT GGAGTAGGGC CTCACACCAT TTCAGTACCC 
CGTATTCGCC CTGCCTTGGG AGTAAATCGA GAAAACTTGC CCTATTTAGT AAATGATGAG 
CAATTTATGA AACTGGTTAC CATTATTCGT CTGGCAGTTC CCTATACCGG CATGATTATT 
TCTACCCGAG AAAGTCCTGA ATACAGGGAT CTGTTGTTAA ATCGAGGAAT ATCCCAAATT 
TCCGCCGGTT CCTGCACCGG GGTAGGAGGT TATAAGAAAG AATTAGAGCG TAAGGCACGC 
CTTGCCAGCG GTAGTAACAA TTGTGGCTGT GGTGAAGAGG ATAGCCCTCA ATTCATGGTT 
GATGATCACC GCAGTCCTGA TGAAGTTCTG CGCAATATTT GTCAATCCGG GTGGTTACCC 
AGTTATTGTA CGGCCTGCTA TCGCAAAGGT CGTACTGGTG ACCGCTTTAT GACTCTGGCT 
AAGAGTGGAG AAATTCAAAA TGTTTGCCAG CCCAATGCTA TTTTGACCTT TAAGGAATAC 
TTATTGGACT ATGCATCCCC CGAGACAAAG GCAGTGGGAG AAGAAACCAT CCGTCAGCAC 
CTGGGAGAAA TTAAAAATGA GCAAGTTCGT AAGATAACAG AAGAAAGATT AAAACAAATT 
GAGGCAGGAG AAAGGGATCT TTATTTTTAA

Protein sequence

MAINKAEIYN NQWEPADFIN EEEINRLLEE GKKTSPARVR EIIEKAREAR GLTPEEVAIL 
LQNDDQDLIN FMFQVASEIK LKIYGKRLVL FAPLYVSDHC VNNCVYCGYR CDNKFNRRKL 
TQAEVEEEIK ILESLGHKRL AVEAGEHPGE CPIEYVLECL KTIYSIKFDN GSIRRCNVNI 
AATTIEEYKM LKDAGIGTYI LFQETYHRET YKKMHPSGPK ADYDWHTTAH DRAMMAGIDD 
VGLGPLFGLY DYKYEVMGLM FHALHMEERF GVGPHTISVP RIRPALGVNR ENLPYLVNDE 
QFMKLVTIIR LAVPYTGMII STRESPEYRD LLLNRGISQI SAGSCTGVGG YKKELERKAR 
LASGSNNCGC GEEDSPQFMV DDHRSPDEVL RNICQSGWLP SYCTACYRKG RTGDRFMTLA 
KSGEIQNVCQ PNAILTFKEY LLDYASPETK AVGEETIRQH LGEIKNEQVR KITEERLKQI 
EAGERDLYF