Gene Apre_0220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0220
Symbol
ID	8396994
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	253720
End bp	254889
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	42%
IMG OID	644994581
Product	amidohydrolase
Protein accession	YP_003151993
Protein GI	257065737
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTAA AATTATCTTA CAGCGATTTA GAAGAAATTA TAGAAATTAG ACACCAAATC 
CATATGCACC CGGAAGTTTC TGACAAGGAA TATAGGACGA CTGAAATTAT AAGAGAATTT 
CTAGAAAAAC TTGAAGGAGT CGAAATAATC GACTTTCCTA TAGAAACAGG GCTAATTGCA 
AGGCTTAAGA CAGGAAAAGC TGGCAAGGTC ATAGGACTTA GGGCAGATAT CGACGCCCTG 
GCCCAGAAGG AAGAGACCGA TATTTCCTAC AAATCAAGGG AAGAAAATAC CATGCACGCC 
TGCGGCCACG ACTACCACAC AGCAAGTCTT TTGGCTGTGG CGAAACTCCT TAGCGAAAAT 
AGGGATAAGC TTTCGGGAGA TGTAGTATTT ATCTTTCAAA GGTCCGAGGA AATCACCAGA 
GGGGCCAAGG AATACGTAGA CAAGGGTCTT TTCGATAAGG TTAAGATCGA TAGGGTCCTA 
GGCTTTCACA ATTGGCCAGA AGTCGACTTC GGGAAGGCTA TAATAAAGAA GGGATCCTTG 
ATGAGTGCCA AGGTAAATTT CAAGATAGAT ATCTTCGGTA AGGGTCAGCA CGGGTCCATG 
CCTCATCTTA ACATAGATCC TATAGTTTGT GCATCAAATA TAGTCATGGC CCTTCAGACC 
ATAATTTCAA GAAACACCAA CCCCTTCGAC TCGATCGTCC TTTCTGTAAA TTCTATAAAT 
GGAGGATCAG AAGACAATCT AGTAGTCGAT AAGACCCATC TATCTGCCAC CATTCGCTCT 
CTTTCTGAGG AAAATCTCGA AAGATCCATT GAAAGGATGG AGGCCATAGT AGAAAATATG 
GCAAAAGCCT ACGAATGTAA GTATGAGATT ACCTACACAG AAAAGATTCC TTCTGTATAT 
AATGGAAAAG ACATGTATGA AAGGGCTCTT TCTTCCGCTA GCAAAGTCTT GGGAGAAGAG 
AACATCCTAA AGGAAGGCCA CACCATGGCC AGTGAGGATT TTGCCTTCTT TATGAAGGAA 
GTTCCTGGAT TTTTCTATTG GTTTGGAAGT GGGGAAGAAG GACATCCGAA AGAAGCCCTT 
CACAGCAAGA ACTACTATTG CTCTGATAAG GCCATAGCCC CTGCCGTAGA AGTACTAGCC 
AGAGCTGTTT TCGATTTCCA AGAATCTTAA

Protein sequence

MNLKLSYSDL EEIIEIRHQI HMHPEVSDKE YRTTEIIREF LEKLEGVEII DFPIETGLIA 
RLKTGKAGKV IGLRADIDAL AQKEETDISY KSREENTMHA CGHDYHTASL LAVAKLLSEN 
RDKLSGDVVF IFQRSEEITR GAKEYVDKGL FDKVKIDRVL GFHNWPEVDF GKAIIKKGSL 
MSAKVNFKID IFGKGQHGSM PHLNIDPIVC ASNIVMALQT IISRNTNPFD SIVLSVNSIN 
GGSEDNLVVD KTHLSATIRS LSEENLERSI ERMEAIVENM AKAYECKYEI TYTEKIPSVY 
NGKDMYERAL SSASKVLGEE NILKEGHTMA SEDFAFFMKE VPGFFYWFGS GEEGHPKEAL 
HSKNYYCSDK AIAPAVEVLA RAVFDFQES