Gene Apre_0943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0943
Symbol
ID	8397729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	1006530
End bp	1007765
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	34%
IMG OID	644995290
Product	peptidase U32
Protein accession	YP_003152692
Protein GI	257066436
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.600634
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAATA ATAAAGTAGA ACTTCTAGCT CCCGCAGGGG ATATGGAAAG ATTAGAAGCA 
GCTATTAAGT TTGGTGCTGA TGCAGTTTTT CTTGCAGGAG ATAGTTTTGG TTTAAGAGCT 
AATGCTAAGA ATTTTGACAA AGATGAACTA AAGAAGGCTG TAAACTTTGC TCATGATAAT 
AATGTAAGGG TCCATGTAAC AATGAATATC TTGCCTCATG ATGAAGATAT GAAGGGTCTT 
GTTGAATATC TAGAGTTTTT AGACTCTATA GGTGTAGATG CCTTAATTAT TTCTGACCCT 
GGCATTTTCG CCTTAGCAAA AGAGCACACC GATGTTGACC TTCATATAAG TACACAAGCT 
TCAGTAACTA ACTCAGCAAC AGTTAAGTTT TGGCACGATA TGGGAGCTAA GAGAGTAATA 
CTTGCTAGGG AGCTTTCTCT AGAAGAAATT AAAGAAGTTA AGAAAAATGC TCCAGAAGAT 
ATGGAAATTG AATGTTTCAT CCACGGTGCT ATGTGTATTT CATATTCAGG TAGATGTCTA 
CTATCAAACT ATATGACTGG TAGAGATGCG AATAGGGGAG ATTGTGCCCA ATCATGCAGG 
TGGAAATATT CTATTCAAGA GGAAACAAGG CCAGGTGAGT ATTATCCAAT TGAAGAAGAC 
GGCAAGGGTG GTACCTTTAT AATGAACTCC AAAGACCTTT GTCTTTTAGA TGAAATTGAT 
AAGCTTATAG AAGCAGGCGT AGATAGCTTT AAAATCGAAG GAAGAATGAA AACAGCCTTT 
TATGTGGCAA CAGTAATAAG AAGCTATAGA CAGGCTATTG ATGCCTATTA TGAGGGTAAT 
TTCAATAAGG ATGTAGCGAA AAAATATTAT GATGAAATCA CTAAGGCAAG TCATAGACAT 
TTTACAAAAG GATTTTTCTA TAAAAAGCCA GACAGTAACG ATCAAATATA TGAAAATTCT 
TCCTATATAA GAAATTATGA TTTCATCGGA GTAGTAGTAG ATTATGATAA GGAAAATAAA 
ATTGCAACAA TTGAGCAAAG AAATAGATTT TTCCTAAATG ATGAGATAGA GATATTCTCA 
AACTCTCCTG ATTATTACGA ATTTAAAATT GATAATATGA AAAACTCTAA GGGAGAGGAC 
ATAGAAGTTG CTAATAAACC GAAAGAGAAG ATTATGATTA AGATTGGTCT TCCTCTTGAA 
AAAGGTGACA TGCTTAGAAG AAAAATTGAA GATTAG

Protein sequence

MKNNKVELLA PAGDMERLEA AIKFGADAVF LAGDSFGLRA NAKNFDKDEL KKAVNFAHDN 
NVRVHVTMNI LPHDEDMKGL VEYLEFLDSI GVDALIISDP GIFALAKEHT DVDLHISTQA 
SVTNSATVKF WHDMGAKRVI LARELSLEEI KEVKKNAPED MEIECFIHGA MCISYSGRCL 
LSNYMTGRDA NRGDCAQSCR WKYSIQEETR PGEYYPIEED GKGGTFIMNS KDLCLLDEID 
KLIEAGVDSF KIEGRMKTAF YVATVIRSYR QAIDAYYEGN FNKDVAKKYY DEITKASHRH 
FTKGFFYKKP DSNDQIYENS SYIRNYDFIG VVVDYDKENK IATIEQRNRF FLNDEIEIFS 
NSPDYYEFKI DNMKNSKGED IEVANKPKEK IMIKIGLPLE KGDMLRRKIE D