Gene Hoch_5290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5290
Symbol
ID	8547702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7274505
End bp	7276148
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	65%
IMG OID	646389964
Product	thiamine pyrophosphate protein domain protein TPP-binding protein
Protein accession	YP_003269668
Protein GI	262198459
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCAT CCGACTTATT CGTTAAAGCG CTCGAAGCCG AAGGTGTGGA ATACGTCTTC 
GGCGTCCCCG GTGAGGAAAA TCTCGATTTC CTCGCCTCCC TCCAGAACTC GTCTATCAAG 
CTGGTGCTCA CCCGGCACGA GCAGGGCGCC GGCTTCATGG CCGCCACCTA CGGACGCCTC 
ACCGGCAAAC CCGGCGTGTG CTTGTCCACG CTCGGCCCGG GCGCGACCAA CCTGGTCACG 
GCCGCCGCCT ACGCCCAGCT CGGCGGCCTG CCGATGTTCA TGCTCACCGG CCAGAAGCCG 
ATCAAGACCA GCAAGCAGGC GCAGTTTCAG ATCGTCGACG TGGTCGACAT GATGCGCCCG 
CTGACCAAGT ACACGCGCCA GATCGTGAGC GCCGACTCCA TCCCCTCGCG GGTGCGCGAG 
GCCTTTCGCC TGGCCCAGGA GGAGCGGCCC GGCGCCGTGC ACCTCGAGCT GCCCGAGGAC 
ATCGCGGCCG AAAACAGCGA GGCCGGCGTC ATCCAGGCCA GCCAGGTGCG GCGGCCGGTG 
GCCGAGGACA AGGCCATCAA GTCGGCGGTC GAGCTCATCG AGAAAGCCTC GCATCCGCTG 
CTGCTCATCG GCGCGGGCGC CAACCGCAAG CTGACCTCGC GCATGCTGCG GCAGTTCATC 
GACAAGACCG GGATTCCCTT CTTCAGCACG CAGATGGGCA AAGGCGTCAT CGACGAGCGC 
GACCCACTGT ACCTGGGCAA CGCGGCGCTG TCCGACAACG ACTTCCTGCA CCGGGCGATC 
GAGCACGCCG ACTTGATCAT CAATGTCGGA CACGACGTCG TCGAAAAACC GCCCTTCTTC 
ATGCACCGCG AGTCCAAGCT CAAGGTCATC CACGTCAACT TCTCGAGCGC CAACGTCGAC 
CCCGTGTACT TTCCGCAAGT GGAAGTGGTC GGCGACATCG CCAACAGCAT CTGGCAGATC 
AAAGAGCGCA TGCTCAAGCA GAGCACCTGG GACTTCTCCT ACTTCCTGAA GGTCAAGGAG 
CGCCTCGAGA TGCACCTGCG CGAGGGCGTG GACGACTGCG CCTTCCCGGT GCAGCCGCAG 
CGCCTGGTCG CCGACGTGCG CCGGGCCATG CCCGAGAGCG GCATCATCGC GCTCGACAAC 
GGCGTGTATA AGATCTGGTT TGCGCGCAAC TACTGGGCCT ACGGACCCAA CACCGTGCTG 
CTCGACAACG CGCTCGCGAC CATGGGCGCC GGCCTGCCCT CGGCCATGGC GGCCAAGCTG 
GTGTATCCCG ATCGCAAGGT CATGGCCATC TGCGGCGACG GCGGCTTCCT GATGAACTCG 
CAGGAGCTCG AGACCGCGGT GCGCCTCAAG CTCGACGTGG TGGTCATGAT CCTGCGCGAC 
GACGCCTACG GCATGATCAA GTGGAAGCAG ACCGCCATGG GCCTGGGCGA CTACGGCCTG 
GACTTCCAGA ACCCCGACTT CGTCAAGTAC GCCGAGAGCT ACGGCGCCCA CGGCCACCGG 
CTCGAGCGCA CCGAAGACCT GCAGTCGCTG GTCGAGCGCT GCCTGAGCAC CCCGGGCGTG 
CACGTCATCG ACGTGCCCGT GGACTACTCG AGCAACGACC GCATCCTCAA CCGCGAGATC 
AAAGAGAAGA GCAAACAGCT CTGA

Protein sequence

MKASDLFVKA LEAEGVEYVF GVPGEENLDF LASLQNSSIK LVLTRHEQGA GFMAATYGRL 
TGKPGVCLST LGPGATNLVT AAAYAQLGGL PMFMLTGQKP IKTSKQAQFQ IVDVVDMMRP 
LTKYTRQIVS ADSIPSRVRE AFRLAQEERP GAVHLELPED IAAENSEAGV IQASQVRRPV 
AEDKAIKSAV ELIEKASHPL LLIGAGANRK LTSRMLRQFI DKTGIPFFST QMGKGVIDER 
DPLYLGNAAL SDNDFLHRAI EHADLIINVG HDVVEKPPFF MHRESKLKVI HVNFSSANVD 
PVYFPQVEVV GDIANSIWQI KERMLKQSTW DFSYFLKVKE RLEMHLREGV DDCAFPVQPQ 
RLVADVRRAM PESGIIALDN GVYKIWFARN YWAYGPNTVL LDNALATMGA GLPSAMAAKL 
VYPDRKVMAI CGDGGFLMNS QELETAVRLK LDVVVMILRD DAYGMIKWKQ TAMGLGDYGL 
DFQNPDFVKY AESYGAHGHR LERTEDLQSL VERCLSTPGV HVIDVPVDYS SNDRILNREI 
KEKSKQL