Gene Moth_1306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1306
Symbol
ID	3831792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1349153
End bp	1350199
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	58%
IMG OID	637829242
Product	threonine synthase
Protein accession	YP_430162
Protein GI	83590153
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.331219
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACTGGC CCGGAGTTAT TCGTGCCTAC CGGGAGTTCC TGCCGGTGAC GGAGGCGACT 
CCCTTGATTA CTTTAGAGGA GGGGAATACC CCCCTGATTG CCGCCGGGAA CCTTTCCCGG 
GAACTGGGGC TAAAACTATA CTTCAAGTAT GAAGGCCTCA ACCCGAGCGG TTCCTTTAAG 
GATCGGGGCA TGGTCATGGC TGTCGCCAAG GCCATGGAGA ACGGTTCCAA GGCCATAATG 
TGCGCTTCCA CGGGCAACAC CTCGGCTTCG GCAGCGGCCT ATGCCGCAAG ATGTGGTTTA 
AAATGCAGCG TCCTGATCCC TGAGGGCAAT ATCGCCCTGG GAAAACTCGC CCAGGCCCTT 
TTTTATGGGG CCAGGGTCAT AGCTATCCAG GGCAATTTTG ACGATGCCCT GACCCTGGTG 
CGCAACATCA CCTCCCGTTA CCCCATTACT CTGGTTAATT CCATCAATCC CTTCCGCATT 
GAAGGGCAAA AAACGGCCGC CTTCGAGATC TGCGACGTGC TGGGGGAGGC TCCGGATTAC 
CTGGCCATTC CTGTAGGTAA CGCCGGCAAT ATCACTGCCT ATTGGAAGGG CTTTAACGAG 
TATTACCAGG CCGGCCGTAG CCATACCCTG CCGAAGATGA TCGGCTTCCA GGCCGAAGGC 
GCAGCACCCA TTGTGCGGGG AGAAGTAGTG CCGAACCCGG AAACCGTAGC CACGGCCATC 
CGCATCGGCA ACCCGGCCAG CTGGCAACCG GCCGTCCGGG CAGCTAAAGA CTCTGGCGGG 
TTTATCGATT GCGTGAGTGA TGACGAAATC CTGGCAGCCC AGCGCCTGCT GGCAACGGCG 
GAAGGCATCT TCGCCGAACC GGCTTCCGCC GCCTCCCTGG CCGGGGTGCT CAAGTATGCT 
AAAAAGGGTT ATTTCCATAA GGATGATAGG GTGGTGTGCG TCCTCACCGG GCATGGCCTT 
AAAGATCCCA ACATCGCCAT CAAACAGGTA GGCGAGCCCA TCTCCCTGCC GGTGGATGAA 
GCCAGGGTTC TGGAGATCGT ACTATAA

Protein sequence

MNWPGVIRAY REFLPVTEAT PLITLEEGNT PLIAAGNLSR ELGLKLYFKY EGLNPSGSFK 
DRGMVMAVAK AMENGSKAIM CASTGNTSAS AAAYAARCGL KCSVLIPEGN IALGKLAQAL 
FYGARVIAIQ GNFDDALTLV RNITSRYPIT LVNSINPFRI EGQKTAAFEI CDVLGEAPDY 
LAIPVGNAGN ITAYWKGFNE YYQAGRSHTL PKMIGFQAEG AAPIVRGEVV PNPETVATAI 
RIGNPASWQP AVRAAKDSGG FIDCVSDDEI LAAQRLLATA EGIFAEPASA ASLAGVLKYA 
KKGYFHKDDR VVCVLTGHGL KDPNIAIKQV GEPISLPVDE ARVLEIVL