Gene Apar_0463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0463
Symbol
ID	8413312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	532459
End bp	533583
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	49%
IMG OID	645022031
Product	peptidase M24
Protein accession	YP_003179485
Protein GI	257784268
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00525602
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGATT TACAGGCGGC CGCAAAGCGC GTTGCGCGTT TTCGCGAGGT AATGGCTCAG 
AGGGGTTACG ACGCTGTTGT CTTGCGTCAC AATCCAGACC TTCGTTGGTT GACTGATGCT 
GAGCGTACCT TTGACTTTGA ACAGGCACAT ACTGCATTTA TTACGCAAGA TGCACTCTTC 
TTACACACTG ACTCTCGTTA CTACAACACA TTCCTGGAGC GCCTTGGCAC TGACTCTCCA 
TGGAAGTTTG ACCAGGAAGC TACTACACCT ACCGAGTGGG TTGCTGCACA TGTTGCTGAG 
GCTCGTGCTC GTGTTGTTGC TATTGAGGAT ACCGTTGACC TTGCTTTCTT TGATGGGCTA 
GAGCAGGCGC TGCGCAATCG TTCAATTGCT GCTCTGCTTC CACGCATGCA TGGTGATATT 
GCTGAGTTGC GTATTGTCAA AGACCCAGCA GAGATTGAGC TTATGAAGCA TGCTCAGTCA 
ATCACTGATA AGGCATTTCT TCACATCTGT GAGTACATCA AGCCAGGCCT CACTGAGCAG 
CAGATTCGTG CAGAACTTGA GAATTACATG CTCTCTAATG GCGCAGATGC TCTGTCCTTT 
GATTCCATCA TTGCTTCTGG CCCTAACGGT GCTAATCCTC ACGCACAGCC AGGCGAGCGT 
GTGGTTCAGA CTGGCGACAT GATTGTTATG GACTACGGTG CGGGCTACTT GGATTACCAC 
TCAGACATGA CCCGTACGGT TGTTGTTGGT GCACCTTCTG AGGAGCAGCA GCATGTCTAC 
GATGTTGTTC GCAAGGCAAA TGAGACTTGC GCTGCAGCTA TTCATGCAGG CGTAACCGGT 
TCTGATATTC ATAATCTTGC AGTTAAGGTT ATCTCTGAGG CTGGTTACGG TGAGTATTTT 
GGACATGGCC TTGGTCATGG TGTTGGTGTT GAGATCCATG AGCGTCCATT CTTTAACCCT 
CGTTGGAATA AGGTTATTGC AGCAGGTTCT GTTGTTACCG ATGAGCCTGG TATCTATCTA 
CCTGGTAAGT TTGGTATCCG TCTTGAAGAT TTTGGTGTTG TTACCGAGGA CGGCTACGAT 
GTCTTTACTC AGTCCACACA CGACCTTGTG TCTGTTGGTT GCTAA

Protein sequence

MADLQAAAKR VARFREVMAQ RGYDAVVLRH NPDLRWLTDA ERTFDFEQAH TAFITQDALF 
LHTDSRYYNT FLERLGTDSP WKFDQEATTP TEWVAAHVAE ARARVVAIED TVDLAFFDGL 
EQALRNRSIA ALLPRMHGDI AELRIVKDPA EIELMKHAQS ITDKAFLHIC EYIKPGLTEQ 
QIRAELENYM LSNGADALSF DSIIASGPNG ANPHAQPGER VVQTGDMIVM DYGAGYLDYH 
SDMTRTVVVG APSEEQQHVY DVVRKANETC AAAIHAGVTG SDIHNLAVKV ISEAGYGEYF 
GHGLGHGVGV EIHERPFFNP RWNKVIAAGS VVTDEPGIYL PGKFGIRLED FGVVTEDGYD 
VFTQSTHDLV SVGC