Gene Apre_1251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1251
Symbol
ID	8398040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	1341665
End bp	1343581
Gene Length	1917 bp
Protein Length	638 aa
Translation table	11
GC content	41%
IMG OID	644995596
Product	peptidase S9 prolyl oligopeptidase active site domain protein
Protein accession	YP_003152996
Protein GI	257066740
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGATA CAAAATTAAG AGATATCTTG GACTATGAAT TCTTATCTAG TCTTGATATT 
TCAAGTGACT ATAGAAAAAT TTCCTACAAA AAAACAATAG GAAATTACAA GGAAAACAGA 
TACGACAGCA ATTTATGGAT TTATGACACC GAAACTTGCG AAAACTATCA AATTACTGAT 
GATAAGAAGG CGACAATTTC TGCCTTTAAC AAGGATTCTA ATCTAGTTTA CAAGAAAGAA 
TCCACAGATG AGGCTGATAT TTTCTATGTC AAAGACGGTA CAGGTCTAGG CCATGAGTAC 
TTTTCTATAG ACAAAGATGT AGATATGATA AAGCACTTAG GAGGCGACCT CTTTCTAGTG 
AAAGCAAAAG AAAAGAAAAG CAAGGAAGAT AAGGAAAAGG ACAAGGAAAA CTCCTACTCT 
AAGGAAATCG ACAAGCTTCC TTTCTACCTA AATGGCGCAG GCTTTATCAA GGATGAGGAC 
TCTGCCCTAT ATTTTTATGA CGCATCAGAA GATAGGCTCG AACTTATCAA GGACTTTAAG 
GCGGAAGATA AGCTAAGCTT TGTCGATATC AGTAAGGATT CTAGCAAAAT CCTCCTCCTT 
AGGGGTAATT TCACAGATAA TTCTGTAATG GAGCTTAAGG AAGACCTCCT CCTTCTCGAT 
ACAAAATCAG GGGAAATGAC CCTCCTAATC GAGAACGAAT TCTCCTACTA TACTGCAAGA 
TTTATCGAAG ATAGGATAAT CTTTGTAGCG ACCGATATGA AAAAGGGCGG GGTCAATGAA 
GATTGTTTTA TTTATTCATG TGACTTTGAG GGAGCTTATA AGAAAATTAG CCCAGACGAT 
TTCGATATGG CCTTTGGTAA TTCCATAGGT ACTGATGCAA GATTCGGATC TTCTAGGACC 
TTCGATGTAA AGGGCGACAG GCTATATTTC GTCGTAACCG ACTATGAAAA GTCCAAGCTC 
TTATCCATAA GTCTTGCTGG AGATATCAGA GAAGAAATCT CAGAAGGCGT TGAAGACTTC 
GTCCTAGGAG ATGATGATAT CTACTACCTT GCAATGGGAG TTGATACTCT TTCTGAGCTT 
AAGAAAAAGT CTACAGGCGA AACTCTTATA GCAAACAAGG TTCCTTCTGA AGTCCACCCT 
ATCGAAACTT TTGACTTCGT ATCAAATGGC GATGAGCTTA CCGGCTACGT CCTCCTTCCA 
AAGGACTTCG ATAAGAAGAA GAAATACCCA ACCCTTCTTT CCGTCCATGG TGGACCAAAG 
ACAGAGTTTT CTGACATCTT CCACCACGAG CACCAGATGT TTGCATCAGC AGGTTACATT 
GTAATTTACA CCAACCCACA CGGTTCAAGT GGTAGAGGAG TCAAGTTCTC CGACATCCGT 
GGCAGATACG GAGATATTGA CTACGATGAC CTTATGACCT TTACCGACCT TGCCATAGAA 
AAATACCCAC AAATCGATAC AGAAAAAATG GGAGTCTATG GCGGAAGTTA CGGTGGTTTT 
ATGACAAATT GGACCATAGG CCACACCGAC CGTTTCGCGG CAGCTTGTAG CCAAAGATCT 
ATCTCAAACT GGACAAGCTT TTATGGAGTA TCAGACATAG GCTACTACTT CGCTCCTGAC 
CAAACAGCAA GCGATATGTG GGATAATCTC GACAAAATGT GGGACCAATC TCCAATCAAA 
TACGCCCCAA AGGTCACGAC CCCAACCCTC TTCATCCACT CTGATGAAGA CTATAGGTGT 
CCACTAGAGC AGGGGCTTCA AATGTATACG AGAATCAAGG AAAATGGCAC AGATACTAAG 
ATGTACATCT TCCATGGGGA AAATCACGAA CTATCTCGAT CTGGAAAACC AAAGGGCAGG 
ATCAAGAGAC TAGAAGCAAT CAAAGAATGG TTTGATAAGT ATCTCAAAGA TGAATAA

Protein sequence

MKDTKLRDIL DYEFLSSLDI SSDYRKISYK KTIGNYKENR YDSNLWIYDT ETCENYQITD 
DKKATISAFN KDSNLVYKKE STDEADIFYV KDGTGLGHEY FSIDKDVDMI KHLGGDLFLV 
KAKEKKSKED KEKDKENSYS KEIDKLPFYL NGAGFIKDED SALYFYDASE DRLELIKDFK 
AEDKLSFVDI SKDSSKILLL RGNFTDNSVM ELKEDLLLLD TKSGEMTLLI ENEFSYYTAR 
FIEDRIIFVA TDMKKGGVNE DCFIYSCDFE GAYKKISPDD FDMAFGNSIG TDARFGSSRT 
FDVKGDRLYF VVTDYEKSKL LSISLAGDIR EEISEGVEDF VLGDDDIYYL AMGVDTLSEL 
KKKSTGETLI ANKVPSEVHP IETFDFVSNG DELTGYVLLP KDFDKKKKYP TLLSVHGGPK 
TEFSDIFHHE HQMFASAGYI VIYTNPHGSS GRGVKFSDIR GRYGDIDYDD LMTFTDLAIE 
KYPQIDTEKM GVYGGSYGGF MTNWTIGHTD RFAAACSQRS ISNWTSFYGV SDIGYYFAPD 
QTASDMWDNL DKMWDQSPIK YAPKVTTPTL FIHSDEDYRC PLEQGLQMYT RIKENGTDTK 
MYIFHGENHE LSRSGKPKGR IKRLEAIKEW FDKYLKDE