Gene VIBHAR_00361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VIBHAR_00361
Symbol	thiH
ID	5556205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio harveyi ATCC BAA-1116
Kingdom	Bacteria
Replicon accession	NC_009783
Strand	-
Start bp	348244
End bp	349371
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	46%
IMG OID	640905855
Product	thiamine biosynthesis protein ThiH
Protein accession	YP_001443609
Protein GI	156972702
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR02351] thiazole biosynthesis protein ThiH

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTTCG TTGAACAATT TAAGCAGCTT AATTGGGATG AAATCTCGAT GTCGATCTAC 
GCGAAAACGG CACAAGATGT TGAGCGAGCA TTGAATAAAC CCAAGCGTGA TTTGGAAGAC 
TTTAAAGCGC TAATTTCACC AGCGGCTGAG GCGTACTTAG AGCAAATGGC GCAGTTGTCA 
TACTCGGCAA CTCGCAAGCG TTTTGGTAAT ACCATGTCGC TTTATATTCC ATTGTACCTT 
TCTAATTTGT GCGCCAATGC TTGTACTTAT TGTGGCTTCT CGATGGAGAA CAGAATCAAG 
CGTCGTACCT TGAATAGGCA CGAAGTGGCT GCAGAAGTTG AAGCTATTAA ATGCATGAAG 
TTCGATAGCG TATTGCTGGT GACTGGCGAA CACGAAACCA AAGTGGGCAT GAAATACTTC 
CGCGAAATGG TGCTGATGAT TAAGCAACGC TTTAACTATT TAGCGATGGA AGTACAGCCA 
CTTGATCAAG ACGAATACGC TGAGCTCAAG ACATTGGGTT TGGATGCGGT GATGGTCTAT 
CAAGAAACGT ATCATCCTTC GACTTATGCC GAGCACCATT TGCGTGGCAA TAAGATGGAT 
TTCGAATACC GATTGGATAC ACCCGATCGT CTTGCAAAAG CGGGCATCGA TAAGATCGGT 
ATTGGCGCAT TGATAGGGTT GGAAGAGTGG CGTACCGATT GCTTTTATGT TGCAGCGCAC 
TTGGACTATC TTGAGCGCAC GTATTGGCAG ACTCGTTACT CAATTTCTTT TCCGCGTTTA 
CGTCCTTGTG AGGGGGCCAG TTCTTTAAAC GGAAAGCAGC CAAAATCAGT CATGACGGAT 
AAGCAACTTG TTCAGCTGAT TTGCGCTTAT CGTTTGTTGA ATCCAGAAGT GGAGTTGTCA 
TTGTCGACTC GTGAGTCACC GAAGTTTAGA GATAACGCAT TGCCTTTAGG CATTACCAGT 
ATGTCTGCAG CATCGAAAAC TCAGCCGGGT GGTTATGCGA TGGATGATGT TGAACTCGAG 
CAGTTTGAGA TCAGCGATGA GCGAAGCGCG GCTTCTGTGG AATATATGAT TCGAGCCAAA 
GGGTTTGACC CAGTATGGCG AGATTGGCAC TCGGCGTATT CTGGTTAA

Protein sequence

MSFVEQFKQL NWDEISMSIY AKTAQDVERA LNKPKRDLED FKALISPAAE AYLEQMAQLS 
YSATRKRFGN TMSLYIPLYL SNLCANACTY CGFSMENRIK RRTLNRHEVA AEVEAIKCMK 
FDSVLLVTGE HETKVGMKYF REMVLMIKQR FNYLAMEVQP LDQDEYAELK TLGLDAVMVY 
QETYHPSTYA EHHLRGNKMD FEYRLDTPDR LAKAGIDKIG IGALIGLEEW RTDCFYVAAH 
LDYLERTYWQ TRYSISFPRL RPCEGASSLN GKQPKSVMTD KQLVQLICAY RLLNPEVELS 
LSTRESPKFR DNALPLGITS MSAASKTQPG GYAMDDVELE QFEISDERSA ASVEYMIRAK 
GFDPVWRDWH SAYSG