Gene Apar_0459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0459
Symbol
ID	8413308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	528756
End bp	530111
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	45%
IMG OID	645022027
Product	aminodeoxychorismate lyase
Protein accession	YP_003179481
Protein GI	257784264
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCACTC CATCTAATGA TTCTTCTCCG CGTCGTCAGG GCGCACATTT TTCTTCTTCT 
GTATCAGAGG GACAGGCCCA GGAAGAACAG ATACAGGAAA AACAAACTCA ACAAGACTCA 
GCGCACTATA ACGCTGGTTC GCAAGAGGCG CTTCAGCAGC CTCCTGTTGA AGCTACGGGA 
TCGCTGCCTG CACTTACTGG CGGTAAGCTT TCATCAAGAA GTGCTCAAGT TACGCATAAG 
GCAAAAAATA AGCAGGTCAA GCATAGAGAC AGGAAGGCTT CAAAGTGCTC TCGTATTTTT 
GCAACGCTTA TCGCTTTTGT TATGGTTGCA GCTCTTGGCA TTTTTGTGTG GAAAGTTGCA 
CTTCCAGAGC TTTCTCGCAC TAACTCTGAT ACACAAGAAA TTACCGCTGG TCAGCAAGTT 
ACTGTTACCA TTCCAGATGG TGCTGGTGCG CAGGAAGTTG CAAAGATTCT TTTTGAGAAC 
AAGATTATTG CTACTAAGAG CGAGTTCTTA GATCAGGTAA AGCGCCAGGA TGCTGAGCAG 
AAAATCAAGA GTGGTAGTTA TGTTATTACC ACTGGTACCA AGCCAGCAGA CATCGTACAC 
CTTCTTGTTT CTGGTCCAAA TGCCCCTGGC AGTGGCTTCG TCGTACCAGA AGGCTATACC 
GTTTCTCAAG TTGCTGATTT GGCTCAGAAC TACTTTGGCA TTTCTCGCGA TGATTTCTTA 
AATCAGGCAA AAGCATCCAA TTATGTTGCT GACTATCCGT TCCTTGCCGG TGCGGTAGAT 
GCTAACGATT CTCTTGAAGG TTATTTGTTC CCTAAGACGT ATACCTTTAC GGAAAGCAAC 
GTAACCGCTG ATACTGTCAT TCGTGCCATG CTTGATCAAT TTAAGGCAGA GACGGCCAAT 
CTTAACTTGG ACGCTGCTCG TATTACGCTC AACAAACGTT ACAACTTGAA TCTTACTAAC 
GAGCAAATCA TTACCATGGC ATCAATTATT GAGCGAGAAG CTCTGACTGA TGAGGATCGT 
CCTAAGGTTG CGTCTGTTTT CTACAACCGC CTGTATGATG ATATGTATCT ACAAAGTGAT 
GCAACTCTTG CATATTCCTT GGGTAGAGAA GCTACTGCTG AAGAGTTAAG CTCAATGACA 
AGCGATCCGT ATAATACCTA CGCGTTCAAG GGCTTGACCC CTACGCCTAT TTGCTCTCCA 
GGTTATGCCT CTATTAAGGC GGCAATGGAT CCAGCAGCAA CCAATTATTA CTACTTCTGG 
ATTACCTCAG ATGAACATGT ATTCTCTGAG ACTTATGACG AGCATCAACA GGCTATTGAA 
AACGCACGCG AGCGTGAAGC CGCAAGCAAA CAGTAA

Protein sequence

MPTPSNDSSP RRQGAHFSSS VSEGQAQEEQ IQEKQTQQDS AHYNAGSQEA LQQPPVEATG 
SLPALTGGKL SSRSAQVTHK AKNKQVKHRD RKASKCSRIF ATLIAFVMVA ALGIFVWKVA 
LPELSRTNSD TQEITAGQQV TVTIPDGAGA QEVAKILFEN KIIATKSEFL DQVKRQDAEQ 
KIKSGSYVIT TGTKPADIVH LLVSGPNAPG SGFVVPEGYT VSQVADLAQN YFGISRDDFL 
NQAKASNYVA DYPFLAGAVD ANDSLEGYLF PKTYTFTESN VTADTVIRAM LDQFKAETAN 
LNLDAARITL NKRYNLNLTN EQIITMASII EREALTDEDR PKVASVFYNR LYDDMYLQSD 
ATLAYSLGRE ATAEELSSMT SDPYNTYAFK GLTPTPICSP GYASIKAAMD PAATNYYYFW 
ITSDEHVFSE TYDEHQQAIE NAREREAASK Q