Gene Acid345_0688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0688
Symbol
ID	4071333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	846535
End bp	847776
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	60%
IMG OID	637982694
Product	L-threonine ammonia-lyase
Protein accession	YP_589767
Protein GI	94967719
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01124] threonine ammonia-lyase, biosynthetic, long form [TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACCC ACACTCCGCA TCGGCCCGCC GCGTCTGTAA CGCTCGAATC CATCGAGCAG 
GCGCGCGCCC GCATTCGCGC CGATGTTTAC TTCTCCCCCT GCAACCACTC GCACTCAATC 
TCCAAGATCG CCGGCCAGCG CGTATACCTG AAGCTCGAAA ATCTCCAGAT GACCGGTTCC 
TTCAAGGAAC GTGGCGCGCT CAACAAAATT CTCACGCTCT CCAACGACGA GAAGCAGCGT 
GGCGTCATCG CAGCCAGCGC TGGCAATCAC GCGCAAGGTG TCTCGTTCCA CGCCACGCGC 
CATGGCATTC GCGCCCGCAT CGTCATGCCG ATGATGACGC CTTTGGTTAA AGTCAATGCC 
ACGCGCGGCT ACGGCGCCGA AGTCATCCTC CATGGCGCCG ACTACGACGA AGCTTACGAA 
GAAGCTTGCC GCCTCGCCGC CCTCGAAGGC CTCGTATTCA TTCATCCTTT TGACGATCCG 
CAGGTCATCG CCGGGCAGGG AACCATCGCG CTCGAATTGC TCGAGCAAGC GCCCGACATG 
GAAGCTGTCG TCGTGCCCAT CGGCGGCGGA GGTCTTATCA GCGGCATCGC TTGCGCATTG 
AAATCCCTGC GTCCGGATAT CCGCGTCATC GGCGTGCAGG CCGCGCGTAT GCCTTCCATG 
CAAAGTGCAT TGCAAGCGCA CAAGGCGGTC ACCATTGATT CGAACACCAC TATCGCTGAT 
GGCATCGCTG TCCGCCGATC CGGCGATCTC ACTGTCCATC TCGTCGAAAG CTACGTCGAC 
GAACTCGTCG TCGCCGAAGA AGAAGAAATT GCCAGCGGCA TCCTCACCCT GCTCGAACGC 
GAGAAGACTC TCGCCGAAGG CGCCGGCGCC GCAGCAGTCG CCGCCCTGTT ACACCACAAA 
ACTTCGCTGA AAAATGAAAA GACCGTTGCC CTCGTTTGCG GCGGCAACAT CGACGTCTCG 
TTGCTGGCCC GCATCATCCA GCGCGGTCTT GCCAAAGACG GCCGCCTCGT CCGGCTGCAG 
ATCCATCTCT CCGATCGTCC CGGCTCGTTG CATCAACTTA CGCGCCTACT TACCGTGCAT 
CAGGCCAACA TCGTCGAATT ACACCATGAC CGCACCTACT ATGGCGTGAA CCTCGGCGAC 
ACCATGATTG ACGTCACCCT GGAGGCTCGC GGGGAGGAGC AGATCCAGCA GATCCTCCAC 
GGCCTGCGGC AGGAGGGTTA TAGGCATGAG CGCATTGTGT AA

Protein sequence

MATHTPHRPA ASVTLESIEQ ARARIRADVY FSPCNHSHSI SKIAGQRVYL KLENLQMTGS 
FKERGALNKI LTLSNDEKQR GVIAASAGNH AQGVSFHATR HGIRARIVMP MMTPLVKVNA 
TRGYGAEVIL HGADYDEAYE EACRLAALEG LVFIHPFDDP QVIAGQGTIA LELLEQAPDM 
EAVVVPIGGG GLISGIACAL KSLRPDIRVI GVQAARMPSM QSALQAHKAV TIDSNTTIAD 
GIAVRRSGDL TVHLVESYVD ELVVAEEEEI ASGILTLLER EKTLAEGAGA AAVAALLHHK 
TSLKNEKTVA LVCGGNIDVS LLARIIQRGL AKDGRLVRLQ IHLSDRPGSL HQLTRLLTVH 
QANIVELHHD RTYYGVNLGD TMIDVTLEAR GEEQIQQILH GLRQEGYRHE RIV