Gene SNSL254_A0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0004
Symbol	thrC
ID	6484714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3734
End bp	5020
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	56%
IMG OID	642735449
Product	threonine synthase
Protein accession	YP_002039231
Protein GI	194444103
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.70048
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCT ATAATCTGAA AGACCATAAT GAGCAGGTCA GCTTTGCGCA GGCCGTCACG 
CAAGGACTGG GCAAACAGCA GGGACTTTTT TTTCCGCACG AACTGCCGGA GTTTAGCCTG 
ACGGAAATTG ATGAGATGCT CAACCAGGAC TTTGTCAGCC GTAGCGCAAA GATCCTCTCG 
GCATTTATTG GCGATGAAAT ACCGCAGCAA ATTCTGGAAG AGCGCGTCCG CGCGGCGTTT 
GCGTTCCCGG CGCCGGTAGC GCAGGTAGAA AGCGATGTCG GCTGCCTGGA GCTGTTCCAT 
GGTCCGACGC TGGCCTTTAA AGACTTCGGC GGGCGTTTTA TGGCGCAAAT GCTGACGCAT 
ATCAGCGGCG ACAAACCGGT GACGATTCTG ACCGCAACGT CAGGCGATAC CGGCGCGGCG 
GTGGCTCACG CGTTCTATGG CCTGGAAAAT GTGCGGGTCG TCATTCTCTA CCCGCGCGGT 
AAAATCAGTC CGTTGCAGGA AAAACTGTTC TGTACGCTGG GCGGCAACAT TGAAACCGTG 
GCGATCGACG GCGATTTCGA CGCTTGCCAG GCGCTGGTGA AACAGGCATT TGATGACGAA 
GAACTGAAAA CGGCGCTGGG GCTGAATTCA GCTAATTCGA TTAATATCAG CCGCCTGTTG 
GCGCAAATTT GCTACTACTT TGAAGCCGTG GCGCAATTGC CGCAGGGGGC GCGTAACCAA 
CTGGTGATCT CTGTACCCAG CGGCAACTTT GGTGATTTGA CGGCAGGACT GCTGGCGAAG 
TCGTTAGGCC TACCGGTGAA ACGTTTTATC GCCGCCACCA ACGTCAACGA CACGGTGCCG 
CGTTTCCTGC ATGACGGGAA GTGGGCGCCG AAAGCGACGC AGGCGACCCT GTCGAATGCG 
ATGGATGTCA GCCAGCCGAA TAACTGGCCG CGCGTGGAGG AGCTATTCCG CCGTAAAATC 
TGGCGTCTGA CTGAGCTGGG CTATGCGGCG GTGGATGACA CTACGACACA ACAGACGATG 
CGCGAGCTGA AAGCGAAAGG TTATATCTCG GAACCTCATG CAGCGGTAGC GTATCGGGCA 
TTACGCGACC AGTTAAACCC TGGCGAGTAT GGCTTGTTTC TCGGAACGGC GCATCCGGCG 
AAGTTTAAAG AAAGCGTGGA GTCCATTCTG GGAGAAACGC TGGCCTTGCC TGAAGCGCTC 
GCCGAACGCG CCGACCTGCC GCTGCTTTCA CATCATCTGC CTGCGGATTT TGCCGCCCTG 
CGTAAGCTGA TGATGACCCG CCAGTAA

Protein sequence

MKLYNLKDHN EQVSFAQAVT QGLGKQQGLF FPHELPEFSL TEIDEMLNQD FVSRSAKILS 
AFIGDEIPQQ ILEERVRAAF AFPAPVAQVE SDVGCLELFH GPTLAFKDFG GRFMAQMLTH 
ISGDKPVTIL TATSGDTGAA VAHAFYGLEN VRVVILYPRG KISPLQEKLF CTLGGNIETV 
AIDGDFDACQ ALVKQAFDDE ELKTALGLNS ANSINISRLL AQICYYFEAV AQLPQGARNQ 
LVISVPSGNF GDLTAGLLAK SLGLPVKRFI AATNVNDTVP RFLHDGKWAP KATQATLSNA 
MDVSQPNNWP RVEELFRRKI WRLTELGYAA VDDTTTQQTM RELKAKGYIS EPHAAVAYRA 
LRDQLNPGEY GLFLGTAHPA KFKESVESIL GETLALPEAL AERADLPLLS HHLPADFAAL 
RKLMMTRQ