Gene BCI_0046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCI_0046
Symbol	thiH
ID	4056749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Baumannia cicadellinicola str. Hc (Homalodisca coagulata)
Kingdom	Bacteria
Replicon accession	NC_007984
Strand	+
Start bp	55603
End bp	56751
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	36%
IMG OID	637981405
Product	thiH protein
Protein accession	YP_588524
Protein GI	94676692
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR02351] thiazole biosynthesis protein ThiH

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.081488
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAACTT TTAGTCAGTG TTGGCAAAAA ATAGATTGGA ATACAGCTAG TTTACGTATT 
CATAGTAAGA GTGAGCAAGA CGTAGAACGA GCCCTTAATA CTAATAGTCC TAGTACAGAA 
GATATGATGG CGTTGCTATC GCCATCAGCT AAAAATTATC TAGAACCACT AGCACAGCGG 
GCGCGTTATT TAACGCGTCA GCGTTTCGGT AATACTGTTA ACTTTTTTGT ACCACTTTAT 
CTATCGAATT TTTGTACCAA TGAATGTAGT TATTGTGGTT TCTCGATTAG TAATCGTATA 
CAACGTAAAA TTCTTGATGA GCAAGAAATT ATACAAGAAT GCGAAGTAAT TAGTGCCCAA 
AATGTTGATA ATATACTTCT CGTCACTGGA GAACATAAAC ATAAAGTAGG TATAGAATAT 
TTCCGTCGTT ACGTACCAAA AGTACGTAAA TATTTTACGT ACATTATGAT GGAAGTACAG 
CCTCTTTTAT CACAAGAGTA TGCTGAATTA AAGACACTAG GGTTAAATAG TATTTTAGTT 
TACCAAGAAA CTTATCATTT ACCAACCTAT CAGATTCATC ATCTACGTGG TAAAAAACGT 
GATTTTTTTT GGCGGTTAGA AACTCCTGAT CGCATAGCTA GTGTTGGTAT AGATAAAATT 
GGTTTAGGAG TATTAATAGG ACTCTCGCAG GACTGGCGCA CTGATTGTTA TATGGTAGCC 
CGGCATCTAC TTTATTTACG CAATCACTAT TGGCGTATTA ACTACTCTCT TTCTTTTCCC 
CGACTTCGTC CTTATCCTGG ACAAGGAGTA ATACCTTCAT CTTTAATTGA TGAAGCTCAG 
TTATTACAAG TTATGTGTGC CTTTCGTTTA TTTGCTCCTG AAGTAGAAAT TTCTCTTTCT 
ACTAGAGAGT CTCCATATTT CCGTGATCAT ATTGTACCAA TCGTAGTAAA TAGTGTCAGT 
GCGGGTTCAA AAACACAACC AGGTGGTTAT GCTAGTGAAA AACCGGAATT AGAACAGTTT 
TTACCATCAG ATAATCGTTC TATGCAAGAA GTAGCGCAAG CATTTATCCA TGCTGGGCTA 
CAACCTATAT GGAAAGATGG ACTAGAAAAG CCATTTGTTT GTTCACCTAC AACGACAAAA 
AAATATTAA

Protein sequence

MITFSQCWQK IDWNTASLRI HSKSEQDVER ALNTNSPSTE DMMALLSPSA KNYLEPLAQR 
ARYLTRQRFG NTVNFFVPLY LSNFCTNECS YCGFSISNRI QRKILDEQEI IQECEVISAQ 
NVDNILLVTG EHKHKVGIEY FRRYVPKVRK YFTYIMMEVQ PLLSQEYAEL KTLGLNSILV 
YQETYHLPTY QIHHLRGKKR DFFWRLETPD RIASVGIDKI GLGVLIGLSQ DWRTDCYMVA 
RHLLYLRNHY WRINYSLSFP RLRPYPGQGV IPSSLIDEAQ LLQVMCAFRL FAPEVEISLS 
TRESPYFRDH IVPIVVNSVS AGSKTQPGGY ASEKPELEQF LPSDNRSMQE VAQAFIHAGL 
QPIWKDGLEK PFVCSPTTTK KY