Gene Apre_1062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1062
Symbol
ID	8397849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1134811
End bp	1136019
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	37%
IMG OID	644995409
Product	threonine dehydratase
Protein accession	YP_003152810
Protein GI	257066554
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR00260] threonine synthase [TIGR01124] threonine ammonia-lyase, biosynthetic, long form [TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0280706
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCAA ATTTAGAAAT GATTAAAGAA GCAAGAGAAA TTCTTGAAGG TAATATTGAA 
AAGACTCCAA TATATACAGC ATCTAGAATG GGTGAGAATC TCTATATCAA GATGGAAAAC 
TTACAAAAAA CAGGTTCCTT TAAACTAAGA GGAGCCTTCA ACAAGATTGC CCACCTTACA 
GATGAACAAA AGAAAAAAGG TGTAATATCT TGTTCAGCAG GAAACCACGC CCAAGGTGTG 
GCCCTATCAG CAACTAGACA AGGGATCAAA TCATATATAT GTATCCCATC AATTGCTCCT 
CTTTCTAAGA TCGAAGCTAC TAGGGGCTAT GGTGGTGAAG TAATCATAGT AGATGGAACC 
TTTGATGATG CTCAAGCTAA GGCTTATGAG CTTCAAAAAG AAAGAGATCT AACTTACGTT 
GCACCTTTTG ATGATGAATA TGTACTATCT GGACAAGGTA CTATAGGTCT TGAAATCTTA 
GATCAACTTC CAGATGTAAA ATACATCGTA GTTCCAATAG GTGGGGGTGG ACTAATTTCA 
GGAATAGCCT TGGCTGTAAA ATCCCTAAGA CCAGATGTAA AAATCATAGG TGTGGAACCA 
GAAAATGCAG CATCAATGCT CGCTTCAAGA AAAGCAGGGA AAATTGTAAC ACTTGATTCT 
GCAAACACTA TGGCTGATGG TATAGCTGTC AAAAAACCAG GCGAGATTAC CTTTGACCTA 
TGCGAAAAAT ATGTCGATGA AATAGTAACA GTATCAGAAG ATGAAATAAC CAACGCCATC 
CTAAGACTTC TAGAAGAAAG TAAGGTAAGT GCAGAAGGAG CAGGAGCTTC ATCTGTTGCT 
GCAGTACTTT CAAACAAATA TGATTTCTCT GATGGAAAAG TCTGTGCGGT TCTTTCTGGT 
GGTAATATTA ACGTTAACAC AATCTATCAA ATCATTAACT CCGGTTTATT TAAAACTGGA 
AGACTTACAG AAATTACCAC AACAATCTCC GATAAACCAG GTGAGCTAAT CAGACTTCTC 
ACTATAATCA AAGACTTGGG CGCAAATATC AAAAATATCG ACCAATTTAA ATCAGCAGAA 
ACAGTTGGAT TTGACCATGC AGTAGTAAGA ATTATAGCAG AAACTTATAA CAAAGAACAT 
AGAAACCAAG TTTACCAAGC TCTAGCAGAT GCTGGATATG CAGAAAGTCA TATAAGACGC 
AACAAATAA

Protein sequence

MTANLEMIKE AREILEGNIE KTPIYTASRM GENLYIKMEN LQKTGSFKLR GAFNKIAHLT 
DEQKKKGVIS CSAGNHAQGV ALSATRQGIK SYICIPSIAP LSKIEATRGY GGEVIIVDGT 
FDDAQAKAYE LQKERDLTYV APFDDEYVLS GQGTIGLEIL DQLPDVKYIV VPIGGGGLIS 
GIALAVKSLR PDVKIIGVEP ENAASMLASR KAGKIVTLDS ANTMADGIAV KKPGEITFDL 
CEKYVDEIVT VSEDEITNAI LRLLEESKVS AEGAGASSVA AVLSNKYDFS DGKVCAVLSG 
GNINVNTIYQ IINSGLFKTG RLTEITTTIS DKPGELIRLL TIIKDLGANI KNIDQFKSAE 
TVGFDHAVVR IIAETYNKEH RNQVYQALAD AGYAESHIRR NK