Gene SeD_A4565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4565
Symbol	thiH
ID	6873901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4407458
End bp	4408591
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	55%
IMG OID	642787473
Product	thiamine biosynthesis protein ThiH
Protein accession	YP_002218075
Protein GI	198243870
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR02351] thiazole biosynthesis protein ThiH

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.000453457
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAACCT TCAGCGACCG TTGGCGGCAA CTGGAGTGGG ACGATATTCG CCTGCGCATC 
AACGGTAAAA CTGCCGCCGA CGTGGAGCGC GCGCTGAACA CCGCACATCT TAGCCGGGAC 
GATTTGATGG CGTTGCTCTC CCCCGCCGCC GCCAATTATC TGGAACCGAT GGCGCAGCGG 
GCACAAAGGC TGACCCGACA ACGCTTTGGC AACACCGTCA GTTTCTATGT GCCGCTTTAT 
CTCTCAAACC TCTGTGCCAA CGACTGCACC TACTGCGGTT TTTCGATGAG CAACCGCATC 
AAGCGTAAGA CGCTGGATGA GGTGGATATT CAAAGGGAGT GCGATGCTAT CCGTAAACTG 
GGCTTTGAGC ATCTGTTGCT GGTGACTGGC GAACATCAGG CCAAAGTAGG AATGAACTAT 
TTTCGCCGCC ATTTACCGGC TATCCGCCGT CAATTTTCAT CATTACAGAT GGAAGTCCAG 
CCCTTGTCGC AAGAAAACTA CGCGGAGCTC AAAACGCTGG GGATCGATGG CGTGATGGTT 
TATCAGGAAA CTTACCATGA GGCAATCTAT GCACAGCATC ACCTGAAGGG AAAGAAACAG 
GACTTTTTCT GGCGGCTGGA AACGCCGGAT CGGTTAGGCC GGGCAGGTAT CGACAAAATC 
GGTCTTGGCG CGCTAATTGG TCTGTCGGAC AACTGGCGGG TGGATTGCTA TATGGTGGCG 
GAGCATCTGT TGTGGATGCA GAAACACTAC TGGCAGAGTC GCTATTCTGT TTCCTTCCCG 
CGTCTGCGTC CGTGTACTGG CGGTGTGGAA CCCGCATCTG TGATGGATGA AAAGCAACTG 
GTGCAAACGA TTTGCGCTTT CCGGTTATTG GCGCCGGAAA TTGAATTATC ACTCTCCACC 
CGCGAATCGC CGTGGTTTCG AGACCATGTG ATTCCTCTGG CAATCAACAA CGTCAGCGCC 
TTCTCAAAAA CGCAGCCCGG CGGCTACGCT GACGATCATC CGGAACTGGA GCAGTTTTCT 
CCCCACGATG CCCGTCGGCC TGAAACAGTA GCAAGCGCGT TAAGCGCGCA AGGATTGCAG 
CCCGTCTGGA AAGACTGGGA CAGTTGGCTG GGGCGCGCTT CGCAAACGCG GTGA

Protein sequence

MKTFSDRWRQ LEWDDIRLRI NGKTAADVER ALNTAHLSRD DLMALLSPAA ANYLEPMAQR 
AQRLTRQRFG NTVSFYVPLY LSNLCANDCT YCGFSMSNRI KRKTLDEVDI QRECDAIRKL 
GFEHLLLVTG EHQAKVGMNY FRRHLPAIRR QFSSLQMEVQ PLSQENYAEL KTLGIDGVMV 
YQETYHEAIY AQHHLKGKKQ DFFWRLETPD RLGRAGIDKI GLGALIGLSD NWRVDCYMVA 
EHLLWMQKHY WQSRYSVSFP RLRPCTGGVE PASVMDEKQL VQTICAFRLL APEIELSLST 
RESPWFRDHV IPLAINNVSA FSKTQPGGYA DDHPELEQFS PHDARRPETV ASALSAQGLQ 
PVWKDWDSWL GRASQTR