Gene PC1_0211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PC1_0211
Symbol	thiH
ID	8131119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pectobacterium carotovorum subsp. carotovorum PC1
Kingdom	Bacteria
Replicon accession	NC_012917
Strand	-
Start bp	251815
End bp	252936
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	55%
IMG OID	644863487
Product	thiamine biosynthesis protein ThiH
Protein accession	YP_003015807
Protein GI	253686617
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR02351] thiazole biosynthesis protein ThiH

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTCG ATTTTCAAAC CGTCTGGGAA CAGCTCGACT GGGATGACCT GACGCTACGC 
ATCAACGGCA AAACCGCACA GGATGTTGAA CGGGCGCTCA CTGCACCACA CCTGACGCAT 
GACGATTTTA TGGCGCTCAT TTCACCTGCC GCCAGCGCCT ATCTGGAACC GCTTGCCCAG 
CGGGCGCAGC AGCTCACCCG CCAGCGTTTC GGCAATACGG TGAGTTTCTA TGTCCCGCTG 
TATTTGTCCA ATCTGTGCTC TAACGACTGT ACCTACTGCG GCTTTTCGAT GAGCAACCAC 
ATCAAGCGTA AAACGCTGGA TGAGGCAGAG ATCTTGCGTG AATGCGCCGC TATCAAAGAA 
CTCGGATTTG AGCACCTGCT GCTCGTCACG GGTGAACACC AGCGTAAAGT GGGGATGGAC 
TATTTTCGGC GCGTTTTTCC ACTTATCCGG CCGCTTTTCA GTTCCCTGAT GATCGAAGTT 
CAGCCGTTGT CGCAGGACGA GTACGCCGAA TTAAAAGCAC TGGGGCTGGA TGGTGTGATG 
GTCTATCAGG AAACCTATCA TACGGCAACC TACCAACTGC ATCATCTAAA AGGACAAAAG 
CAGGATTTCC ACTGGCGGCT TGCCACACCG GATCGGCTTG GCCGTGCCGG GATCGATAAG 
ATCGGGCTAG GTGCCTTAAT CGGCCTGTCC AATAGCTGGC GTACCGACTG CTACATGGTG 
GCAGAGCACC TGTTGCACTT GCAGCAGCAC TACTGGCAGA GCCGGTATTC TATCTCGTTC 
CCTCGCCTGC GCCCCTGTGC GGGCGGCATT GAACCGGCGT CGTTAATGGA TGAAGCACAG 
CTGATGCAGG TGATTTGCGC ATTCCGCTTG CTGGCGCCGG ATATTGAATT GTCGCTGTCC 
ACACGTGAAT CACCGTTCTT TCGCGATCAT GCGATCCCTA TCGCGATTAA CAACGTCAGC 
GCCTTCTCCA AAACCCAACC GGGTGGCTAC GCCGATGACC ATCCTGAACT GGAACAATTT 
TCTCCCCACG ATTCACGGCG TCCTGAAGAC GTAGCGCAGG CCATCGTGCG TGCAGGTCTT 
CAGCCAGTAT GGAAAGACTG GGACGGCTAT TTGGGCAGAT AA

Protein sequence

MSVDFQTVWE QLDWDDLTLR INGKTAQDVE RALTAPHLTH DDFMALISPA ASAYLEPLAQ 
RAQQLTRQRF GNTVSFYVPL YLSNLCSNDC TYCGFSMSNH IKRKTLDEAE ILRECAAIKE 
LGFEHLLLVT GEHQRKVGMD YFRRVFPLIR PLFSSLMIEV QPLSQDEYAE LKALGLDGVM 
VYQETYHTAT YQLHHLKGQK QDFHWRLATP DRLGRAGIDK IGLGALIGLS NSWRTDCYMV 
AEHLLHLQQH YWQSRYSISF PRLRPCAGGI EPASLMDEAQ LMQVICAFRL LAPDIELSLS 
TRESPFFRDH AIPIAINNVS AFSKTQPGGY ADDHPELEQF SPHDSRRPED VAQAIVRAGL 
QPVWKDWDGY LGR