Gene Pcar_0608 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pcar_0608
Symbol	thiH
ID	3724062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pelobacter carbinolicus DSM 2380
Kingdom	Bacteria
Replicon accession	NC_007498
Strand	-
Start bp	739855
End bp	740967
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	61%
IMG OID	637750193
Product	thiamine biosynthesis protein ThiH
Protein accession	YP_356037
Protein GI	77918222
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR02351] thiazole biosynthesis protein ThiH

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	0.499964
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATTTTC TCGACGAATT CAACAGCTAC GATCGCAGCG AGCTTGCGGA ACGGATCATG 
TCATGCCAGG CCGCCGATGT GGAACGGGCG CTGACGGCGG AACATCTGCG AAGTGCCGAT 
TTCATGGCGC TGCTGTCGCC GATGGCGCAC GGTTACCTGG AGTCGATGGC ACAAAAAGCC 
CACCGTCTGA CCCAGCAGCG TTTCGGCAAG ATCATCCAGC TCTATGCGCC GCTGTACATC 
TCCAACGAAT GCAGCAACGG TTGTCTGTAC TGCGGCTTCA ACGCCGCCAA CAAGGTCGCG 
CGGCGCACCT TGAGCCTGGA CGAAGTCGAA GCCGAGGCCC GCATCCTGCG CCAGCGCGGT 
TTCCGCCATG TGCAGTTACT GACCGGCGAG GCACCGCAGG CGGTCGATGT CGATTTTCTG 
GAAAATGTTG TCAAACGCGT ACGACCGTTT TTTTCTTCCA TCAGCATCGA AGTCTTCCCC 
ATGGACGAGG CCGGTTATCG CCAACTGGTG GCGGCCGGCG TCGACAACCT GACCGTCTAT 
CAGGAGACGT ACGACCGTGA CCTGTACGAC AAACTGCATC CCTTCGGTCG CAAGAAAGAT 
TTCAATTGGC GACTGACCAC TCCCGATCGT GGCGGCGCGG CGGGACTGCG CTCGATTGGC 
ATCGGTAGCC TGCTGGGGCT GAGTGACTGG CGCATCGAGG GCTACCTGGT CGGCATGCAT 
GCCCGCCACC TGGTACGCAC CTGGTGGCGC AGCCGGGTGA ATGTATCCTT CCCGCGCATG 
CGACCTGCCG ACGGCGGTTT TCAGCCACCG AAACCGGTAT CCGACAGTGC CCTGGTGCAA 
CTGATCTGCG CGCTGCGGCT GTTGATACCC GACGCCGGAC TGGTACTGTC GACGCGCGAA 
AGCGCCAGTT TGCGCGATCA TCTGCTGCCT TTGGGTATCA CCCAGCTGAG TGCCGGGTCC 
AGCACCGCGC CAGGCGGATA CGGACATCAG CAGGATGGCA GCGAACAGTT TGCTATCGAC 
GATGATCGTA ACGCCGAACA GATTTGCGCC ATGCTGCGCG CCCAGGGATA CGAGCCGGTA 
TGGAAGGACT GGGACGGCGC CTTTGTGAAA TAG

Protein sequence

MNFLDEFNSY DRSELAERIM SCQAADVERA LTAEHLRSAD FMALLSPMAH GYLESMAQKA 
HRLTQQRFGK IIQLYAPLYI SNECSNGCLY CGFNAANKVA RRTLSLDEVE AEARILRQRG 
FRHVQLLTGE APQAVDVDFL ENVVKRVRPF FSSISIEVFP MDEAGYRQLV AAGVDNLTVY 
QETYDRDLYD KLHPFGRKKD FNWRLTTPDR GGAAGLRSIG IGSLLGLSDW RIEGYLVGMH 
ARHLVRTWWR SRVNVSFPRM RPADGGFQPP KPVSDSALVQ LICALRLLIP DAGLVLSTRE 
SASLRDHLLP LGITQLSAGS STAPGGYGHQ QDGSEQFAID DDRNAEQICA MLRAQGYEPV 
WKDWDGAFVK