Gene SeD_A0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0004
Symbol	thrC
ID	6874263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3734
End bp	5020
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	56%
IMG OID	642783264
Product	threonine synthase
Protein accession	YP_002213958
Protein GI	198242395
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCT ATAATCTGAA AGACCATAAT GAGCAGGTCA GCTTTGCGCA GGCCGTCACG 
CAAGGACTGG GCAAACAGCA GGGACTTTTT TTTCCGCACG ATCTGCCGGA GTTTAGCCTG 
ACGGAAATTG ATGAGATGCT CAACCAGGAC TTTGTCAGCC GTAGCGCAAA GATCCTCTCG 
GCATTTATTG GCGATGAAAT ACCGCAGCAA ATTCTGGAGG AGCGCGTCCG CGCGGCGTTT 
GCGTTCCCGG CGCCGGTAGC GCAGGTAGAA AGCGATGTCG GCTGCCTGGA GCTGTTCCAT 
GGTCCGACGC TGGCCTTTAA AGACTTCGGC GGGCGTTTTA TGGCGCAAAT GCTGACGCAT 
ATCAGCGGCG ACAAACCGGT GACGATTTTG ACCGCAACGT CAGGCGATAC CGGCGCGGCG 
GTGGCTCACG CGTTCTATGG CCTGGAAAAT GTGCGGGTCG TCATTCTCTA CCCGCGCGGT 
AAAATCAGTC CGTTGCAGGA AAAACTGTTC TGTACGCTGG GCGGCAACAT TGAAACCGTG 
GCGATCGACG GCGATTTTGA CGCTTGCCAG GCGCTGGTGA AACAGGCATT TGATGACGAA 
GATCTGAAAA CGGCGCTGGG GCTGAATTCG GCTAATTCGA TTAATATCAG CCGCCTGTTG 
GCGCAAATTT GCTACTACTT TGAAGCCGTG GCGCAACTGC CGCAGGGGGC GCGTAACCAA 
CTGGTGATCT CCGTCCCCAG CGGCAACTTT GGCGATTTGA CGGCAGGGCT GCTGGCGAAG 
TCGTTAGGCC TACCGGTGAA ACGTTTTATC GCCGCCACCA ACGTCAACGA CACGGTGCCG 
CGTTTTCTGC ATGACGGGAA GTGGGCGCCG AAAGCGACGC AGGCGACCCT GTCGAATGCG 
ATGGATGTCA GCCAGCCGAA TAACTGGCCG CGCGTGGAGG AGCTATTCCG CCGTAAAATC 
TGGCGTCTGA CTGAGCTGGG CTATGCGGCG GTGGATGATT CTACGACACA ACAGACGATG 
CGCGAGCTGA AAGCGAAAGG TTATATCTCG GAACCTCATG CGGCGGTAGC GTATCGGGCA 
TTACGCGACC AGTTAAACCC TGGCGAGTAT GGCTTGTTTC TCGGAACGGC GCATCCGGCG 
AAGTTTAAAG AAAGCGTGGA GTCCATTCTG GGAGAAACGC TGGCCTTGCC TGAAGCGCTC 
GCCGAACGCG CCGATCTGCC GCTGCTTTCA CATCATCTGC CTGCGGATTT TGCCGCCCTG 
CGTAAGCTAA TGATGACCCG CCAGTAA

Protein sequence

MKLYNLKDHN EQVSFAQAVT QGLGKQQGLF FPHDLPEFSL TEIDEMLNQD FVSRSAKILS 
AFIGDEIPQQ ILEERVRAAF AFPAPVAQVE SDVGCLELFH GPTLAFKDFG GRFMAQMLTH 
ISGDKPVTIL TATSGDTGAA VAHAFYGLEN VRVVILYPRG KISPLQEKLF CTLGGNIETV 
AIDGDFDACQ ALVKQAFDDE DLKTALGLNS ANSINISRLL AQICYYFEAV AQLPQGARNQ 
LVISVPSGNF GDLTAGLLAK SLGLPVKRFI AATNVNDTVP RFLHDGKWAP KATQATLSNA 
MDVSQPNNWP RVEELFRRKI WRLTELGYAA VDDSTTQQTM RELKAKGYIS EPHAAVAYRA 
LRDQLNPGEY GLFLGTAHPA KFKESVESIL GETLALPEAL AERADLPLLS HHLPADFAAL 
RKLMMTRQ