Gene Emin_1229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1229
Symbol
ID	6263795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1329024
End bp	1330274
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	42%
IMG OID	642611707
Product	threonine synthase
Protein accession	YP_001876116
Protein GI	187251634
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA TACTAAACTT ACAATGTATA AATTGCGGTA AAGAATATAA AACAAGCGCA 
ACGGACTTTC TTTGTTTATC CTGCGGGAGC AACCTGGAAG TCAATTATGA TTATAAGTTA 
ATTTCTAAAC GTTTTAAAAT AGAGAATTTT AAAGATAAAA AACGCTTTGA TATGTGGCGT 
TATATAGATT TGCTGCCCGT TAACGATTTT GATAAACTGC CCTATGTGCA AGTAGGCTGG 
ACGCCGATGT ACGACCACAA AGAACTTGCA GATGAACTTG GTATATCAAA ACTTTTAATT 
AAGGACGAAG GACGCAACCC CACAGGTTCA ATCAAAGACC GCGGCAGCGC GGTGTCTGTG 
GCAAGAGCTT TGGAACTTGG ATTAGATATA ATAGCGGACG CTTCCACAGG CAACGCAAGT 
GATTCTTTGG CCTGTTTAAC CGCCGGTTTA GATATTAAAA CAATTGTTTT TACAACCAAA 
GATGCGCCGT ATCCCAAACT TACTCAGCTT TTTGTGTATG GGGCGGATGT CTTTACCGTA 
GACGGCACTT ATGACGATGC TTTTGAGCTT TGCAAAAAAG CGGTTGAAGA ATACGGCTGG 
TATTCCAGGG CGGCGGGGTA TAATCCTTTT ACAAGGGAAG GCAAGAAAAC ATGCTCGTTT 
GAAATATGCG AGCAGCTCAA CTGGGAAGCC CCGGATAAAG TGCTTGTCGC CGTGGGCGAT 
GGGACTATTT TAAGCGGTAT GTGGAAAGGT TTTGTTGATT TTCAAAAACT TGGTATTTTG 
GAAAAAATGC CGCAAATGAT AGCTGTGCAA GCAGAAGGCA GCGACGCTAT AAAAAGAGCT 
TTTGAAAACA AAGGCGAGGT TACCGCCGTT AAAGCGCATA CGATAGCTGA CAGTATTTTA 
GTTAATTACC CGCGTGACGC GCAGCTTGCG GTTCAGGCTT TGCAGGAATC AGACGGGTAC 
GCCGTTACGG TAACGGATGA AGAAATACTT GCCGCTATAC CCGAGTTTGC CAGAAAGGCC 
AACATTTTTG CCGAACCGGC GGGCGCGGCT GTTTACGCCG CTCTTAAAAA ATTAGCGGAG 
GAAGGTAAAA TAGAACAGGA TGAAACCGTT GCTATTGTTA TAGGCGGCAA CGGACTTAAA 
GACACGTATT CTTACGCTAA AAACATACAG AAAGCGGAAG TAATTTCAAA AGATTTTGAA 
GCATTTAAAA TAACGGCCAA AGAAAAAGGG CTTATAAAAA CAGATAAATA A

Protein sequence

MKKILNLQCI NCGKEYKTSA TDFLCLSCGS NLEVNYDYKL ISKRFKIENF KDKKRFDMWR 
YIDLLPVNDF DKLPYVQVGW TPMYDHKELA DELGISKLLI KDEGRNPTGS IKDRGSAVSV 
ARALELGLDI IADASTGNAS DSLACLTAGL DIKTIVFTTK DAPYPKLTQL FVYGADVFTV 
DGTYDDAFEL CKKAVEEYGW YSRAAGYNPF TREGKKTCSF EICEQLNWEA PDKVLVAVGD 
GTILSGMWKG FVDFQKLGIL EKMPQMIAVQ AEGSDAIKRA FENKGEVTAV KAHTIADSIL 
VNYPRDAQLA VQALQESDGY AVTVTDEEIL AAIPEFARKA NIFAEPAGAA VYAALKKLAE 
EGKIEQDETV AIVIGGNGLK DTYSYAKNIQ KAEVISKDFE AFKITAKEKG LIKTDK