Gene Elen_0567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0567
Symbol
ID	8414852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	719657
End bp	721225
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	67%
IMG OID	645023539
Product	threonine synthase
Protein accession	YP_003180941
Protein GI	257790335
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.167411
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTGC AGGACATGGC TCAAAACCTC TACTCCGACA CGCGCGGGCA AAGCGAGCGC 
CCCGTCACCT TTACGGAAGC CGTCATCGAC GGCCTGGCCG CGGGCGGCGG CTTGTACGTG 
CCCGAACGCA TCCCCGAGCT TTCCCTCGAC GAGATCGGAG CGCTGGCCGA GCTGCCGTAC 
GCCCAGCGCG CGGCGCGCAT CTATCGGGCG TTCGACGTGG ATCTGCCCGC CGAAACCGTC 
GAAGCGCTTA TGGCCCAGGC TTACGGCGAC AACTTCGACG ACGAGCGCAT CTGCCCCATC 
ACGTCGCTTT CGGCCGACAC CCACGTGCTG GAGCTATGGC ACGGCCCCAC GAGCGCGTTC 
AAGGACATGG CGCTGCAGTG CCTGCCGCGT TTCTTCTCCG CAAGCGCCGC CCAGCTGCGC 
GAGCAGGGCA AGCTCGACCA CGACTTCCTC ATCCTGGTAG CCACCTCGGG AGACACGGGC 
AAAGCCGCGC TCGAGGGCTT CCGCGACGTG GACGGCGTGT CCATCGGCGT CATGTACCCC 
GACGGCGGCG TGAGCGACAT CCAGTTCAAG CAGATGGCCA CGCAGCGCGG GCGCAACGTG 
CAGGTATGGG GCGTGCGCGG AAACTTCGAC GACTGCCAGA CGGGCGCGAA AAACGTGTTC 
GGCGACGAGG CCTTTGCGAA GAAGCTGCAG GACGAGCACC GCATCGCTCT TTCCAGCGCG 
AACTCCATCA ACTGGGGGCG CCTCATGCCC CAGATCGTGT ACTACGTGTC GGCCTACGCG 
CAGCTGGCGG CCGACGGCAA ACTGAACCTG GGCGACGAGC TGGACGTATG CGTGCCCACG 
GGCAACTTCG GCAACATCCT GGCCGCCTAC TACGCCAAGC GCATGGGCGT GCCGCTGGGC 
ATGCTGTACT GCGCCAGCAA CGAGAACCGC GTGCTCACCG ACTTCATCAA CACGGGCACC 
TACGACATAT CCGAGCGCCC CTTCGTGCTG ACGCCCTCGC CGTCCATGGA CATCCTCGTT 
TCGTCGAACC TGGAGCGTCA GCTGTTCGAG CTCACGGGAC GCGACGCCGC CGCCATAGCC 
GGCTGGATGG CCGACCTGCG CGGGCAGCGC CGCTTCCGCG TGGACGAAGA GACCTTCGCC 
CGCGTGCGGG AGCTGTTCGC GTCGGACTCC ATCGACAACG CCACGTGCCT GGACACCATC 
AAGCGCGTGT TCGAGCAGCA CGGCTACCTG TTGGACCCGC ACACGGCCGT GGCCTACCAG 
ACCGCCGAGA ACCTTCGGGG CGAGAACCCC GTGCTCATCG CGAGCACGGC GCACTGGGCC 
AAGTTCGGCG ACAACGTGTA CCGCGCGCTG CACGGCATCG AGCCTGGCGC GCCGCTGCCC 
GACGACGTGG CCGCGCTGTC GGGCTGCAAG CTGAACGAGC TGATCGCGCG CGAGACGGGC 
GTCGACGACA TCCCCCACGG CCTGGCTGAG CTGGACGCGC TTCCCATCCG CTTCGACGAG 
GTCATCGACG GCGGCACGAA CGACATCGAG GCGGCGGCAC TGCGTTTCCT CGAGCACCTG 
GACGACTGA

Protein sequence

MKVQDMAQNL YSDTRGQSER PVTFTEAVID GLAAGGGLYV PERIPELSLD EIGALAELPY 
AQRAARIYRA FDVDLPAETV EALMAQAYGD NFDDERICPI TSLSADTHVL ELWHGPTSAF 
KDMALQCLPR FFSASAAQLR EQGKLDHDFL ILVATSGDTG KAALEGFRDV DGVSIGVMYP 
DGGVSDIQFK QMATQRGRNV QVWGVRGNFD DCQTGAKNVF GDEAFAKKLQ DEHRIALSSA 
NSINWGRLMP QIVYYVSAYA QLAADGKLNL GDELDVCVPT GNFGNILAAY YAKRMGVPLG 
MLYCASNENR VLTDFINTGT YDISERPFVL TPSPSMDILV SSNLERQLFE LTGRDAAAIA 
GWMADLRGQR RFRVDEETFA RVRELFASDS IDNATCLDTI KRVFEQHGYL LDPHTAVAYQ 
TAENLRGENP VLIASTAHWA KFGDNVYRAL HGIEPGAPLP DDVAALSGCK LNELIARETG 
VDDIPHGLAE LDALPIRFDE VIDGGTNDIE AAALRFLEHL DD