Gene SeD_A4570 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4570
Symbol	thiC
ID	6874685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4410927
End bp	4412822
Gene Length	1896 bp
Protein Length	631 aa
Translation table	11
GC content	59%
IMG OID	642787478
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_002218080
Protein GI	198244147
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.0133622
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTACAA CAACGTTAAC CCGCCGCGAG CAGCGCGCTA AAGCCCAGCA TTTTATCGAT 
ACGCTGGAAG GCACCGCGTT TCCCAACTCG AAACGCATCT ACGTGACCGG TTCGCAGCAT 
GATATTCGCG TACCGATGCG CGAAATTCAA CTTAGCCCCA CGCTCATCGG CGGCAGTAAA 
GACAACCCGC AGTTTGAAGA GAACGAAGCC GTACCGGTAT ACGACACCTC CGGCCCCTAT 
GGCGATCCTG AGGTGGCGAT TAACGTCCAG CAGGGTCTGG CGAAACTGCG CCAGCCATGG 
ATTGACGCAC GTAACGATAG CGAAGAATTA GACGACCGTA GCTCGGCTTA TACCAGAGAA 
CGTCTGGCCG ACGATGGCCT GGACGATCTG CGTTTTACCG GCCTACTGAC GCCAAAACGC 
GCTAAAGCGG GCAAGCGCGT CACCCAGTTA CACTACGCCC GCCAGGGGAT CGTCACTCCC 
GAAATGGAGT TCATCGCCAT CCGTGAAAAT ATGGGCCGTG AGCGCATTCG CAGCGAAGTG 
CTGCGCCACC AGCATCCGGG GATGAACTTT GGCGCGCGCC TGCCGGAAAA CATCACCCCG 
GAATTCGTGC GTGATGAAGT CGCCGCGGGC CGCGCGATTA TTCCCGCCAA CATCAACCAC 
CCGGAATCGG AGCCGATGAT TATCGGCCGC AACTTCCTGG TGAAGGTCAA CGCTAATATC 
GGTAACTCGG CGGTCACCTC CTCCATCGAA GAAGAGGTGG AAAAACTGGT GTGGTCAACC 
CGCTGGGGCG CGGATACGGT TATGGACCTC TCCACCGGCC GCTATATCCA CGAAACCCGC 
GAATGGATCC TGCGTAACAG CCCGGTACCG ATCGGCACCG TCCCGATCTA CCAGGCGCTG 
GAAAAGGTCA ACGGGATCGC CGAAGATCTT ACCTGGGAAG CGTTCCGCGA CACGCTGCTG 
GAGCAGGCCG AACAGGGCGT CGACTACTTC ACCATCCACG CCGGCGTGCT GCTGCGCTAC 
GTGCCGATGA CCGCCAAACG CCTGACCGGT ATTGTCTCGC GCGGCGGTTC GATCATGGCG 
AAGTGGTGTC TCTCCCATCA CAAAGAGAAC TTCCTGTTCG AACATTTCCG CGAGATCTGC 
GAAATCTGCG CCGCCTACGA CGTTTCCCTG TCGTTGGGCG ACGGCCTGCG CCCCGGCTCC 
ATTCAGGACG CCAACGACGA AGCGCAGTTC TCCGAGCTGC ATACGCTGGG CGAGCTGACC 
AAAATCGCCT GGGAATACGA CGTGCAGGTG ATGATTGAAG GCCCGGGTCA TGTACCCATG 
CATATGATTC AGCGCAACAT GACCGAAGAG CTGGAGAGCT GCCATGAAGC ACCGTTCTAC 
ACCTTAGGGC CATTGACTAC CGATATCGCG CCGGGCTATG ACCACTTCAC CTCCGGGATC 
GGTGCCGCGA TGATCGGCTG GTTTGGCTGC GCGATGCTGT GTTATGTGAC GCCGAAAGAG 
CATCTCGGCC TGCCGAACAA AGAAGATGTG AAGCAGGGGC TAATCACCTA CAAAATCGCC 
GCCCACGCCG CGGATTTAGC CAAAGGACAT CCGGGCGCGC AGATCCGCGA TAACGCCATG 
TCGAAAGCGC GCTTCGAATT CCGCTGGGAA GATCAGTTTA ACCTCGCGCT CGACCCGTTC 
ACCGCCCGCG CTTATCACGA TGAAACCCTG CCGCAGGAGT CCGGCAAAGT CGCCCACTTC 
TGTTCCATGT GCGGGCCGAA ATTCTGCTCG ATGAAAATCA GCCAGGGGGT CCGCGACTAC 
GCCGCCGCGC AAGCCATTGA AGTCGGCATG GCGGATATGT CGGAGAACTT CCGCGCCAAA 
GGCGGCGAAA TTTATCTCAA ACGGGAGGAA GCCTGA

Protein sequence

MSTTTLTRRE QRAKAQHFID TLEGTAFPNS KRIYVTGSQH DIRVPMREIQ LSPTLIGGSK 
DNPQFEENEA VPVYDTSGPY GDPEVAINVQ QGLAKLRQPW IDARNDSEEL DDRSSAYTRE 
RLADDGLDDL RFTGLLTPKR AKAGKRVTQL HYARQGIVTP EMEFIAIREN MGRERIRSEV 
LRHQHPGMNF GARLPENITP EFVRDEVAAG RAIIPANINH PESEPMIIGR NFLVKVNANI 
GNSAVTSSIE EEVEKLVWST RWGADTVMDL STGRYIHETR EWILRNSPVP IGTVPIYQAL 
EKVNGIAEDL TWEAFRDTLL EQAEQGVDYF TIHAGVLLRY VPMTAKRLTG IVSRGGSIMA 
KWCLSHHKEN FLFEHFREIC EICAAYDVSL SLGDGLRPGS IQDANDEAQF SELHTLGELT 
KIAWEYDVQV MIEGPGHVPM HMIQRNMTEE LESCHEAPFY TLGPLTTDIA PGYDHFTSGI 
GAAMIGWFGC AMLCYVTPKE HLGLPNKEDV KQGLITYKIA AHAADLAKGH PGAQIRDNAM 
SKARFEFRWE DQFNLALDPF TARAYHDETL PQESGKVAHF CSMCGPKFCS MKISQGVRDY 
AAAQAIEVGM ADMSENFRAK GGEIYLKREE A