Gene Dtur_1658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtur_1658
Symbol	thiH
ID	7082177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dictyoglomus turgidum DSM 6724
Kingdom	Bacteria
Replicon accession	NC_011661
Strand	+
Start bp	1672275
End bp	1673384
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	34%
IMG OID	643458767
Product	thiamine biosynthesis protein ThiH
Protein accession	YP_002353544
Protein GI	217968038
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR02351] thiazole biosynthesis protein ThiH

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCAGGG AGATTCTTAA AGAAGCAGAT GAAATCTTGA GAAAATCTCA TGTCTTAGAG 
AATAAAGGAG GAAATGTCAG AAAAATAATT GATAAAGACA AGATATCAAA AGAGGACCTT 
TTTATTCTCC TCACTGATAA TTCCGATGAA ACTTTAATAT TAATGGCTAA TAAAGCAAAG 
AGACTTACAG AAAGGTATTT CGGAAAAGTT ATAACCCTAT TTACTCCTCT TTACCTTTCT 
AATTATTGTC TTTCTCCCTG TGAGTACTGT GGATTCTCAG CTAAACTTCA AATTCCAAGG 
AAGAAACTAA AGGAGGAAGA GATAATAAGA GAATACGAAG CCATCAAACA AACCAGCATT 
GACAGTATTT TACTTTTAAC AGGTTGTGAT AAAATTAATA CTCCCTTTGA ATATATCCTC 
TATGCAGTTA AACTTGCTAA AAAATATTTT TCAGAGATCT CCATTGAAGC ATATCCTATG 
GAGGAGGAAG AATACAGAGT CTTAGTAAAG GAGGGTTTAA CAGGAGTTGT TCAATATCAA 
GAAACTTATA ATAAGGAAAC CTATAAGAAG CTCCACCCTG TAGGTCCTAA GAGTGATTAC 
GAATATAGAT TACATACTCA AGAAAGAGCA CTAAATGCAG GAGTTTATGA GGTAACTGTA 
GGAGTACTTT TAGGAATTAA TGATCCCTAT GAAGATGTGT TTAAGAGCAT TCTTCATGCG 
GAGTACCTCT CTCAAAAATA TCCAAAGGCT GAGATTAATA TATCTTTCCC AAGATTTAGA 
GACCCCAAAA CAGGCTTCAA ACCCAAGTAC CAAGTAAACG AAAAATTACT TTTAAGGTTT 
ATTTTCTGTG CAAGAATTTA CCTACCCCAT GTAGGAATAA CCATATCCAC AAGAGAAAAC 
AGCAGATTCA GAGATAATAT CATTGGCTAT GGAGTCACTA AAATGTCTGC AGGTTCAAAA 
ACTACTGTAG GGGGATATGC TCAAACTGAA ACAACAAGTG TTCAATTTGA AACTGATGAC 
AGAAGAACTG TAAATGAAGT TATTAATGCA ATAAAAAATA GAGGATATAG ACCAGAATTC 
ACAAATTGGA TAAAAGGAGG CCTATATTAA

Protein sequence

MLREILKEAD EILRKSHVLE NKGGNVRKII DKDKISKEDL FILLTDNSDE TLILMANKAK 
RLTERYFGKV ITLFTPLYLS NYCLSPCEYC GFSAKLQIPR KKLKEEEIIR EYEAIKQTSI 
DSILLLTGCD KINTPFEYIL YAVKLAKKYF SEISIEAYPM EEEEYRVLVK EGLTGVVQYQ 
ETYNKETYKK LHPVGPKSDY EYRLHTQERA LNAGVYEVTV GVLLGINDPY EDVFKSILHA 
EYLSQKYPKA EINISFPRFR DPKTGFKPKY QVNEKLLLRF IFCARIYLPH VGITISTREN 
SRFRDNIIGY GVTKMSAGSK TTVGGYAQTE TTSVQFETDD RRTVNEVINA IKNRGYRPEF 
TNWIKGGLY