Gene Apar_0233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0233
Symbol
ID	8413081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	269150
End bp	270412
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	45%
IMG OID	645021801
Product	peptidase M20
Protein accession	YP_003179256
Protein GI	257784039
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.571831
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAAGCA GAACTAATTT TGACGCATCC AAACTTCCTA ACAACCTACC AGAAGTTGCA 
AAAATGACAG CACAACTTGT TGCTCTTAAA AGTACTGATC CTGGTTCTTA TGAAGAAGAG 
ATTGAAACAT TTATTAAAAC GTGGATTGTT AACTCGTGTT CTTTTTCACT GCCCAATAAA 
AAAGAGATGT TTCCTATCAT CCAAGAAGTT GAAGTTTTTC CTCATAGACG TTGCCTTAGG 
GCAACAATCC CCAGTGCTAC CACATCATTT GATTCCTCTA CACTCCCCCC ATCAGACCTG 
ACATTTATCT GCCATATGGA TACCGTAACT GATGGCGATG GCTGGGACTC TGAAACACCT 
GCATTCAATC CCGTATATAA AGATGGGCTG CTGTATGGAC GAGGCTCATG TGATATGAAA 
GGGGGGCTTG CCTGTGCACT TCTCGCCTTT AGAGACGCTT GTCAGACATG CAAGACACAA 
AAGACACTTC CACAAAAATC TCTTTCTGTC ATCTTCACAG TTGACGAAGA AGCTAATATG 
CGCGGCGTTG AACGTGTTAT AGACGCTGGT TGGGTTGGCG AGAAAGGCTG GGTACTTGAC 
GCTGAGCCTA CAAACAACGC CATCCGTGGA TCTCACAAAG GTCGAACCTG GTTCAAAATT 
ACTGTTACCG GAATCACAGC TCACGCAAGC ACCCCTTGGA AAGGTGCTGA TGCTATCGCT 
GCAATGGCAA TTGTTATAAA TGAGATACGA ACTGCAGTGC AGAGCCTACC CACTCATCCA 
GAGCTTGGAT CATCAACGGT AACCTTTGGG CAGATTTTGG GTGGGTATCA ACCGTACGTT 
GTTCCTGATA AAGCCGAACT CTGGGTTGAC ATGCGCTTAG CACCCCCTAC AACAACGCAA 
GCTGCAGAGC GTATAGTGCA ACAAGCAATC AAGCGAGCCC AAACAGAGAT TTGCGGTACT 
CACGCCAGCT ATGACATTAC GGGAAATAGG CCTTCCGTTG TCCTTCCCAA GGATTCAGAA 
CTTCTCGCAC AGCTTCTCTC GTGTGCAGAA TCTTGCAATA CGCCTGCAAA GCTCGATATT 
TTTACTGGAT ATACCGATAC CGCTGTAATT GCATCCACCT GCAGAAATAC AGAATGTATG 
TCATATGGAC CTGGAGAACT TGAACGTGCT CATAAACCAA ATGAGTACGT TCCTGTAGAA 
GATTTAACAC GCGTATATCG TGTATTTAAA TCACTGATAA AAAGTACCAT ATGCGACTTT 
TAA

Protein sequence

MSSRTNFDAS KLPNNLPEVA KMTAQLVALK STDPGSYEEE IETFIKTWIV NSCSFSLPNK 
KEMFPIIQEV EVFPHRRCLR ATIPSATTSF DSSTLPPSDL TFICHMDTVT DGDGWDSETP 
AFNPVYKDGL LYGRGSCDMK GGLACALLAF RDACQTCKTQ KTLPQKSLSV IFTVDEEANM 
RGVERVIDAG WVGEKGWVLD AEPTNNAIRG SHKGRTWFKI TVTGITAHAS TPWKGADAIA 
AMAIVINEIR TAVQSLPTHP ELGSSTVTFG QILGGYQPYV VPDKAELWVD MRLAPPTTTQ 
AAERIVQQAI KRAQTEICGT HASYDITGNR PSVVLPKDSE LLAQLLSCAE SCNTPAKLDI 
FTGYTDTAVI ASTCRNTECM SYGPGELERA HKPNEYVPVE DLTRVYRVFK SLIKSTICDF