Gene SeHA_C0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0004
Symbol	thrC
ID	6488670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3734
End bp	5020
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	56%
IMG OID	642740298
Product	threonine synthase
Protein accession	YP_002043972
Protein GI	194450589
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCT ATAATCTGAA AGACCATAAT GAGCAGGTCA GCTTTGCGCA GGCCGTCACG 
CAAGGACTGG GCAAACAGCA GGGACTTTTT TTTCCGCACG AACTGCCGGA GTTTAGCCTG 
ACGGAAATTG ATGAGATGCT CAACCAGGAC TTTGTCAGCC GTAGCGCAAA GATTCTCTCG 
GCATTTATTG GCGATGAAAT ACCGCAGCAA ATTCTGGAAG AGCGCGTCCG CGCGGCGTTT 
GCGTTCCCGG CGCCGGTAGC GCAGGTAGAA AGCGATGTCG GCTGCCTGGA GCTGTTCCAT 
GGTCCGACGC TGGCCTTTAA AGACTTCGGC GGGCGTTTTA TGGCGCAAAT GCTGACGCAT 
ATCAGCGGCG ACAAACCGGT GACGATTCTG ACCGCAACGT CAGGCGATAC CGGCGCGGCG 
GTGGCTCACG CGTTCTATGG CCTGGAAAAT GTGCGGGTCG TCATTCTCTA CCCGCGCGGT 
AAAATCAGTC CGTTGCAGGA AAAACTGTTC TGTACGCTGG GCGGCAACAT TGAAACCGTG 
GCGATCGACG GCGATTTCGA CGCTTGCCAG GCGCTGGTGA AACAGGCATT TGATGACGAA 
GAACTGAAAA CGGCGCTGGG GCTGAATTCG GCTAATTCGA TTAATATCAG CCGCCTGTTG 
GCGCAAATTT GCTACTACTT TGAAGCTGTG GCGCAACTGC CGCAGGGGGC GCGTAACCAA 
CTGGTGATCT CCGTCCCCAG CGGCAACTTT GGCGATTTGA CGGCAGGGCT GCTGGCGAAG 
TCGTTAGGCC TACCGGTGAA ACGTTTTATC GCCGCCACCA ACGTCAACGA CACGGTGCCG 
CGTTTTCTGC ATGACGGAAA GTGGGCGCCG AAAGCGACGC AGGCGACCCT GTCGAATGCG 
ATGGATGTCA GCCAGCCGAA TAACTGGCCG CGCGTGGAGG AGCTATTCCG CCGTAAAATC 
TGGCGCCTGA CTGAGCTGGG CTATGCGGCG GTGGATGACA CTACGACACA ACAGACGATG 
CGCGAGCTGA AAGCGAAAGG TTATATCTCG GAACCTCATG CGGCGGTAGC GTATCGGGCA 
TTACGCGACC AGTTAAACCC TGGCGAGTAT GGCTTGTTTC TCGGAACGGC GCATCCGGCG 
AAGTTTAAAG AAAGCGTGGA GTCCATTCTG GGAGAAACGC TGGCTTTGCC TGAAGCGCTC 
GCCGAACGCG CCGATCTGCC GCTGCTTTCA CATCATCTGC CTGCGGATTT TGCCGCCCTG 
CGTAAGCTGA TGATGACCCG CCAGTAA

Protein sequence

MKLYNLKDHN EQVSFAQAVT QGLGKQQGLF FPHELPEFSL TEIDEMLNQD FVSRSAKILS 
AFIGDEIPQQ ILEERVRAAF AFPAPVAQVE SDVGCLELFH GPTLAFKDFG GRFMAQMLTH 
ISGDKPVTIL TATSGDTGAA VAHAFYGLEN VRVVILYPRG KISPLQEKLF CTLGGNIETV 
AIDGDFDACQ ALVKQAFDDE ELKTALGLNS ANSINISRLL AQICYYFEAV AQLPQGARNQ 
LVISVPSGNF GDLTAGLLAK SLGLPVKRFI AATNVNDTVP RFLHDGKWAP KATQATLSNA 
MDVSQPNNWP RVEELFRRKI WRLTELGYAA VDDTTTQQTM RELKAKGYIS EPHAAVAYRA 
LRDQLNPGEY GLFLGTAHPA KFKESVESIL GETLALPEAL AERADLPLLS HHLPADFAAL 
RKLMMTRQ