Gene Apre_1603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1603
Symbol
ID	8398415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1744733
End bp	1746397
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	39%
IMG OID	644995967
Product	alpha amylase catalytic region
Protein accession	YP_003153345
Protein GI	257067089
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000968128
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAA AGTGGTGGCA GAAGGAAATT GTTTATCAGA TTTATCCTAG GTCTTTCAAG 
GACTCGAACA ATGACGGGAT AGGAGATATT AGGGGAATTG TTGAAAAACT TGATTACTTG 
AAGGACTTGG GCATTACTAT GATTTGGCTT TGCCCGATTT ATAAGTCCCC TATGGCCGAC 
AATGGTTATG ACATTTCTGA TTATTTCGAT ATCAATGAAG AGTTTGGCAA CATGGAAGAC 
TTTGATCTTT TGGTTGAAGA AGCGAAAAAA AGAGATATCA AGGTCATGAT GGACCTTGTC 
CTAAACCACA CTTCCAACGA ACATGAGTGG TTTAAGGAGG CGATATCAGA TAAGGATAGT 
CCTTACAGGA ATTATTATAT AATTAGAGAA GGGAAAGAGC CTCCAAACAA CTGGAGATCA 
ATCTTTGGTG GATCTACCTG GACTAAGATT GATGGAGAAG ATGCCTATTA TCTCCACTCC 
TTTGCCAAGG AGCAGCCAGA TCTCAATTGG GAAAACCCTA AGCTTAGAGA AGAAGTGATT 
AATATCGTCA ATTTCTGGAT TGATAAGGGA ATTACAGCCT TTAGAATGGA TGCAATCAAC 
CACATAAAGA AAGATCCTTC ATATAAAAGT GGAGATCCAG ACGGGGCTGA TGGCAGAGTT 
TCTGTCGTAA AATTCGGTAG AAATCAAGAT GGAGTCGAAG AACTCATAAG GATCCTTTCA 
GATAATACTT TCAAGATCCA CGATTCGATG ACTGTGGGCG AGACTGCTGG TCTTTCTTAT 
GACAAGTATG CAAACTACAT CGGTGATGAT GGGGTATTTT CCATGGTATT TGACTTTATC 
CCAGCAAACT TCGACGTGGT CGAAGAAACT TGGTACAAGA GACTTGACTG GAAGGTAAGT 
GACTTTAGAA AGTCAATTTT CGATAGTCAA GAGTCAATCC AAAAATACGG CTGGTCAGCA 
AATTTCATAG AAAACCACGA CCAACCAAGG GCTACTACCA AGATTTTAAG GGAAAAGGAC 
GAGGATATTG ATGCTATAAA GATGCTTGGA GGAATTTATT TCTTCTTTAG GGGAACTCCT 
TATATCTACC AAGGCCAAGA GCTCGGTATG AAAAACTTCG TAAGAGAATC ACCAGACGAC 
TTCCAAGACA TCCAATCCAT AGACTCTTAT AAGAGATCGC TTGAAGAAGG ATTTAGCGAG 
AAGGAAGCCC TCTACTTCAC CAACCTCAGA AGCAGGGACA ACCCAAGAGT TCCTTTCGCC 
TGGACTAATG AAAAGTACGG AGGCTTCTCA GAAACTAAAC CTTGGCTTGC CATGGCCTAC 
GATAATCCTA AAGTAAATGC TGAGGATGAA GAAAAGGATA AGGATTCTGT CCTAAACTTC 
TACAAAAAAA TGATAGACTT TAGGCAAAAT AGCCAGTATT CTGATATCCT AATCTATGGA 
GACTTCAAGC CTTTGGAAGG TTTTGATGAT GAAATAATAG CCTACGAAAG AATCCTAGAT 
GGTAAAAAAC TAGAAATTAT CGCCAACTTC TCAGATGAAG AAAAGAAAAT AGAAGCAAGG 
GGTAAGGATA TAATCTTTTC CAACTCAAAG GGAGAGATTG AAGGAGATAT CTTAAGCTTA 
AATCCATATA GTTTTGTAAT ATTAAAGAAT AAAAATAATA AATAA

Protein sequence

MQKKWWQKEI VYQIYPRSFK DSNNDGIGDI RGIVEKLDYL KDLGITMIWL CPIYKSPMAD 
NGYDISDYFD INEEFGNMED FDLLVEEAKK RDIKVMMDLV LNHTSNEHEW FKEAISDKDS 
PYRNYYIIRE GKEPPNNWRS IFGGSTWTKI DGEDAYYLHS FAKEQPDLNW ENPKLREEVI 
NIVNFWIDKG ITAFRMDAIN HIKKDPSYKS GDPDGADGRV SVVKFGRNQD GVEELIRILS 
DNTFKIHDSM TVGETAGLSY DKYANYIGDD GVFSMVFDFI PANFDVVEET WYKRLDWKVS 
DFRKSIFDSQ ESIQKYGWSA NFIENHDQPR ATTKILREKD EDIDAIKMLG GIYFFFRGTP 
YIYQGQELGM KNFVRESPDD FQDIQSIDSY KRSLEEGFSE KEALYFTNLR SRDNPRVPFA 
WTNEKYGGFS ETKPWLAMAY DNPKVNAEDE EKDKDSVLNF YKKMIDFRQN SQYSDILIYG 
DFKPLEGFDD EIIAYERILD GKKLEIIANF SDEEKKIEAR GKDIIFSNSK GEIEGDILSL 
NPYSFVILKN KNNK