Gene SNSL254_A4496 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4496
Symbol	thiC
ID	6482808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4370628
End bp	4372523
Gene Length	1896 bp
Protein Length	631 aa
Translation table	11
GC content	58%
IMG OID	642739726
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_002043412
Protein GI	194442345
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.000124533
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTACAA CAACGTTAAC CCGCCGCGAG CAGCGCGCTA AAGCCCAGCA TTTTATCGAT 
ACGCTGGAAG GCACCGCGTT TCCCAACTCG AAACGCATCT ACGTGACCGG TTCGCAGCAT 
GATATTCGCG TACCGATGCG CGAAATTCAA CTTAGCCCCA CGCTCATCGG CGGCAGTAAA 
GACAACCCGC AGTTTGAAGA GAACGAAGCC GTACCGGTAT ACGACACCTC CGGCCCCTAT 
GGCGATCCTG AGGTGGCGAT TAACGTCCAG CAGGGTCTGG CGAAACTGCG CCAGCCATGG 
ATTGACGCAC GTAACGATAG CGAAGAATTA GACGACCGTA GCTCGGCTTA TACCAGAGAA 
CGTCTGGCCG ACGATGGCCT GGACGATCTG CGCTTTACCG GCCTGCTGAC GCCAAAACGC 
GCTAAAGCGG GCAAGCGCGT CACCCAGTTA CACTACGCCC GCAAGGGGAT CGTCACTCCC 
GAAATGGAGT TCATCGCCAT CCGTGAAAAT ATGGGCCGTG AGCGCATTCG CAGTGAAGTG 
CTGCGCCACC AGCATCCGGG CATGAACTTT GGCGCGCGCC TACCGGAAAA CATTACGCCG 
GAATTCGTGC GTGATGAAGT CGCCGCGGGC CGCGCGATTA TCCCTGCCAA CATCAACCAC 
CCGGAATCGG AGCCGATGAT TATCGGCCGC AACTTCCTGG TCAAAGTGAA TGCCAACATC 
GGTAACTCGG CGGTCACCTC CTCCATCGAA GAAGAGGTGG AGAAGCTGGT GTGGTCAACG 
CGCTGGGGCG CAGACACGGT GATGGATCTC TCCACCGGCC GCTATATCCA CGAAACCCGC 
GAATGGATCC TGCGTAACAG CCCGGTACCG ATCGGCACCG TCCCGATCTA CCAAGCGCTG 
GAGAAGGTCA ACGGGATCGC CGAAGATCTT ACCTGGGAAG CGTTCCGCGA CACGCTGCTG 
GAGCAGGCCG AACAGGGCGT CGACTACTTC ACCATTCACG CGGGCGTGCT GTTGCGCTAC 
GTGCCGATGA CCGCCAAACG CCTGACCGGT ATTGTCTCGC GCGGCGGTTC GATCATGGCG 
AAGTGGTGCC TCTCGCATCA CAAAGAGAAC TTCCTGTTCG AACATTTCCG CGAAATTTGT 
GAAATCTGCG CCGCCTACGA CGTTTCCCTG TCGTTGGGCG ACGGCCTGCG CCCCGGCTCC 
ATTCAGGACG CCAACGACGA AGCGCAGTTC TCCGAGCTGC ATACGCTGGG CGAATTGACC 
AAAATCGCCT GGGAATACGA CGTGCAGGTG ATGATTGAAG GCCCGGGCCA CGTGCCGATG 
CATATGATTC AGCGCAACAT GACCGAAGAG TTGGAGAGCT GCCACGAAGC GCCGTTCTAC 
ACCTTAGGGC CGTTGACCAC CGATATCGCG CCGGGCTATG ACCACTTTAC CTCCGGCATT 
GGCGCGGCGA TGATCGGCTG GTTTGGCTGC GCGATGCTGT GTTACGTGAC GCCGAAAGAA 
CACCTCGGCC TGCCGAACAA AGAAGATGTG AAGCAGGGGC TGATCACCTA CAAAATCGCC 
GCCCACGCCG CTGACTTAGC GAAAGGCCAT CCGGGCGCAC AGATCCGCGA TAACGCCATG 
TCGAAAGCGC GCTTTGAATT CCGCTGGGAA GACCAGTTTA ACCTCGCGCT CGACCCTTTC 
ACCGCCCGCG CTTATCACGA TGAAACCCTA CCGCAGGAGT CCGGTAAGGT CGCTCACTTC 
TGTTCCATGT GCGGGCCGAA GTTCTGCTCG ATGAAAATCA GCCAGGAAGT CCGCGACTAC 
GCCGCTGCAC AAACTATTGA AATCGGCATG GCGGATATGT CAGAGGACTT CCGCGCCAAA 
GGCGGCGAAA TTTATCTCAA GCGGGAGGAA GCCTGA

Protein sequence

MSTTTLTRRE QRAKAQHFID TLEGTAFPNS KRIYVTGSQH DIRVPMREIQ LSPTLIGGSK 
DNPQFEENEA VPVYDTSGPY GDPEVAINVQ QGLAKLRQPW IDARNDSEEL DDRSSAYTRE 
RLADDGLDDL RFTGLLTPKR AKAGKRVTQL HYARKGIVTP EMEFIAIREN MGRERIRSEV 
LRHQHPGMNF GARLPENITP EFVRDEVAAG RAIIPANINH PESEPMIIGR NFLVKVNANI 
GNSAVTSSIE EEVEKLVWST RWGADTVMDL STGRYIHETR EWILRNSPVP IGTVPIYQAL 
EKVNGIAEDL TWEAFRDTLL EQAEQGVDYF TIHAGVLLRY VPMTAKRLTG IVSRGGSIMA 
KWCLSHHKEN FLFEHFREIC EICAAYDVSL SLGDGLRPGS IQDANDEAQF SELHTLGELT 
KIAWEYDVQV MIEGPGHVPM HMIQRNMTEE LESCHEAPFY TLGPLTTDIA PGYDHFTSGI 
GAAMIGWFGC AMLCYVTPKE HLGLPNKEDV KQGLITYKIA AHAADLAKGH PGAQIRDNAM 
SKARFEFRWE DQFNLALDPF TARAYHDETL PQESGKVAHF CSMCGPKFCS MKISQEVRDY 
AAAQTIEIGM ADMSEDFRAK GGEIYLKREE A