Gene Apre_0243 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0243
Symbol
ID	8397017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	276172
End bp	277782
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	39%
IMG OID	644994604
Product	alpha amylase catalytic region
Protein accession	YP_003152016
Protein GI	257065760
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC ATTGGTGGCA TAAGGCGACT ATTTATCAGA TTTATCCAAG GTCTTTTATG 
GACTCAAACA ATGATGGAAT AGGAGATCTT AGAGGAATTA TTTCTAAGCT CGATTATCTG 
GAAAAGCTCG GGATCAATGC GATTTGGCTT TCTCCAGTTT ACCAGAGTCC AATGGATGAT 
AATGGCTATG ATATATCTGA TTATAGGGCT ATTGCAGATA TTTTTGGCAA TATGGATGAT 
ATGGAGGAGC TCCTAGATGA AGCTAAGAAG AGAGATATTA GAATCATCAT GGATCTTGTT 
GTAAACCATA CCTCAGATGA GCATGCTTGG TTTATAGAGG CGAGAGATAA TCAAGCTAGC 
CCTAAGCGTG ACTATTATAT CTGGAGGAAG GAGAAAAACG GCCTAGAATC TACCTTCTCT 
GGCTCTGCTT GGGAGTATGA TGAGGATTCT GGCGAATATT ATCTCCACTT ATTCAGCAAG 
AAGCAACCAG ACCTTAACTG GGAGAATGAA GACTTGCGTC ATGAAATTTA CGACATGATG 
AACTTCTGGA TTGATAAGGG AATCGGGGGC TTCCGTATGG ATGTAATAGA CCTACTAGGC 
AAAGTTCCTG ATAAAGAAAT CAAGGAAAAT GGACCAATGC TTCATACCTA CCTTAAAGAG 
ATGAACAAAA ATACCTTTGG TAAGCATGAT TTATTGACAG TTGGTGAGAC TTGGGGAGCA 
AGTCCTGAAA TTGCCAAGAA ATATTCAAAT CCAGATAACG AAGAGCTTTC CATGGTATTT 
CAATTTGAGC ATATTGGCCT CCAACACAAG GAGGGTATGG CTAAATGGTT CTATGAAAAG 
GACCTTGATG TAAGCAAGCT TAAGGAAATT TTCGCCAAAT GGCAAACTGA ACTAGAGCTT 
GGCAAGGGTT GGAACTCGCT ATTTTGGGAA AACCACGACC TTCCTAGAGT CCTTTCACTC 
TGGGCAGATG TCGACGAATA TAGGGAAAAA TCAGCCAAGG CTCTCGCCAT TCTCCTTCAT 
CTTATGAGAG GAACTCCTTA TATCTATCAG GGAGAAGAAA TCGGCATGAC CAATTATCCT 
TTCAAGGACT TAGCAGAATT TGAAGATATT GAGTCAATAA ATTATGCCAA GGAATGTCTA 
GAAAAGGGAG AAGACGAGGA AGAGATCCTA GATAGGATAT CTGTTATAGG TCGTGACAAC 
GCTAGGACTC CTATGCAATG GGACGACTCC AAGAATTCGG GCTTTTCTAA GGCGGATAAA 
ACCTGGCTTC CTGTAAATCC AAATTACAAA GAAATAAATG TAGAAGAAGC TCTAAAAGAT 
CCTGATTCAA TATTTTACAC CTACCAAAAA CTAGTTGACC TAAGGAAAAA GAAGGATTGG 
CTAGTAGACG CTGACTTTAA GCTTTTAGAA ACAGATGAGA AAGTCTTCGC CTACACAAGA 
GAGACTGACT TAGAAAAATA TCTCATTGTG GTTAATTTTT CTGGGGAAAG CCAAGACTTT 
GACTTAGAAG AAGATTATAC TGATATTGTA ATTTCTAATA CAGATGTCAA AGAAGTTAAG 
AATTCAGGCA AGCTTAAGGC CTGGGACGCG TTTTGTGTGA AAATTAAATA A

Protein sequence

MKKHWWHKAT IYQIYPRSFM DSNNDGIGDL RGIISKLDYL EKLGINAIWL SPVYQSPMDD 
NGYDISDYRA IADIFGNMDD MEELLDEAKK RDIRIIMDLV VNHTSDEHAW FIEARDNQAS 
PKRDYYIWRK EKNGLESTFS GSAWEYDEDS GEYYLHLFSK KQPDLNWENE DLRHEIYDMM 
NFWIDKGIGG FRMDVIDLLG KVPDKEIKEN GPMLHTYLKE MNKNTFGKHD LLTVGETWGA 
SPEIAKKYSN PDNEELSMVF QFEHIGLQHK EGMAKWFYEK DLDVSKLKEI FAKWQTELEL 
GKGWNSLFWE NHDLPRVLSL WADVDEYREK SAKALAILLH LMRGTPYIYQ GEEIGMTNYP 
FKDLAEFEDI ESINYAKECL EKGEDEEEIL DRISVIGRDN ARTPMQWDDS KNSGFSKADK 
TWLPVNPNYK EINVEEALKD PDSIFYTYQK LVDLRKKKDW LVDADFKLLE TDEKVFAYTR 
ETDLEKYLIV VNFSGESQDF DLEEDYTDIV ISNTDVKEVK NSGKLKAWDA FCVKIK