Gene Apar_1205 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1205
Symbol
ID	8414083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1351941
End bp	1353734
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	52%
IMG OID	645022799
Product	oligoendopeptidase F
Protein accession	YP_003180224
Protein GI	257785007
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1164] Oligoendopeptidase F
TIGRFAM ID	[TIGR00181] oligoendopeptidase F

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATACG AGTCTCGTGG AGAAATTGAC AGCAAATATA AGTGGGACCT GTCTTCAATG 
TTCCCAAGTG ATGAGGCATT TGAGGCTGGA CTTGAGGAGC TCAAGGCTTA CTGCCCAAAA 
CTGCTTGCGT TCAAAGGAAA GATTTCCACT TCCGCTCAGG CTCTTCTGGA GTTCTTGCAG 
CTTGAGGACC AGATGAACCT TCTGCTCTAC AAGATTATCA ACTACGCCGA GCGCAAGAGT 
GACGAGGACA CCCGCGTTGC CAAGTATCAG GCATACGTCG CAAACGCTAC CAGCGTATAT 
ACACAGGCTG GCGAGGCAAC TTCTTGGTTT GCCGCAGAGC TTCTGGCTAT TCCAGCAGAA 
TCTGTCGAGA AGTTCTATGC AGAGGTTCCA GCTCTTGAGT TCTATCGTCG TAAGCTCAAC 
AAGATCTTGA ACCAGCGCGA GCATACCCTC TCTGCTGAGG AAGAGGCTCT TCTGGCACGC 
GCTGAAGAGC TTGCTGTTCA GCCAACCAAC ATCTTTTCCA TGTTTGATGA TGCAGACCTC 
ATCTTTGACG ACGCTGTAGA CTCTGAGGGC AAGACACATA AGCTGACCAG CGGTTCATTT 
GTTCCTTTGC TGATGAATGG CGACCGCGTC CTACGCGAGT CCGCATTTAA GCAGCTCTAC 
AGCCGCTTTG GTGAGTTCCG CAACACCTCC GCTGCAATTC TGACTAGCCA GGTTAAGAAC 
CTGCAGTTCT TCTCGTCATC TAGAAAGTAT GCAAGTTCCC TTGAGGCTGC TCTTGCAGAG 
AACGAGATTC CTGTTGAGGT TTATAACAAC CTCATCGATG CCGTTCACCA GAACTTCCCA 
GCTTTCTACA AGTACGTTGA CCTGCGCAAG CGCGTTATGG GCTTGGATGA GTTGCACTTC 
TGGGACGTCT ACACTCCTCT TGTTGACGAC GTTGACATGA AGTTTACCTA CGAAGAGGCT 
TGCGACCTCA TTGTTAAGGC GCTGGCACCT ATGGGCGAGG AGTACGTTGG CCTGGTCAAG 
AAGGGTCTGG AGAGCCGTTG GGTTGACGTT TACGAAACTC CAGGTAAGCG TTCCGGCGCT 
TATTCTGCAG GTGGCAAGGG TATGAACCCT GTCATGCTCC TCAACTTCCA GGGCGGCCTC 
GACGATGTCT ACACCCTTAT TCACGAGATG GGTCACTCCC TGCACACGTA CTTCTCGTCC 
CACAACCAGG AGATTACCTA CTCTGATTAC TCCATCTTTG TTGCAGAGGT TGCATCTACC 
TGCAACGAGG CGCTGCTCTC GCACTACCTG CTTGAGCACG AGACTGATCC TGCTCGCCAT 
GCGTACATCC TTAACCACTT CCTTGAGGGC TTCCGTGGCA CCATCTATCG CCAGTGCATG 
TTTGCCGAGT TTGAGCGCGA CATCAACCAG ATGAACGCTG ATGGCGTGGC TCTGAACGCT 
GAGGTTCTCT CCGAGCGCTA CGGCAAGCTT TGCGCAGAAT ACTTTGGACC TGGCATTGAG 
CTGGACGAAG AGATCAAGCT GGAGTGGTCG CGCATCCCTC ACTTCTACTA CAACTTCTAT 
GTCTACCAGT ACTGCATTGG TTTCTCGGCA GCTATTGCCC TGTCTCAACG TATCCTTTCT 
AAGGGCGAGC CTGCGGTCAA AGACTACATT GGCTACCTAT CCGGCGGCTG CTCCAAGACT 
CCAATTGAGC TGCTCCGCGG AGCTGGCGTT GACATGGCAA CCCCAGATCC CGTTAATGCT 
GCGCTCAAGT ACTTTGGCGA GCTTGTCGAC CAGCTTGAGC AGGAGCTCAA CTAG

Protein sequence

MAYESRGEID SKYKWDLSSM FPSDEAFEAG LEELKAYCPK LLAFKGKIST SAQALLEFLQ 
LEDQMNLLLY KIINYAERKS DEDTRVAKYQ AYVANATSVY TQAGEATSWF AAELLAIPAE 
SVEKFYAEVP ALEFYRRKLN KILNQREHTL SAEEEALLAR AEELAVQPTN IFSMFDDADL 
IFDDAVDSEG KTHKLTSGSF VPLLMNGDRV LRESAFKQLY SRFGEFRNTS AAILTSQVKN 
LQFFSSSRKY ASSLEAALAE NEIPVEVYNN LIDAVHQNFP AFYKYVDLRK RVMGLDELHF 
WDVYTPLVDD VDMKFTYEEA CDLIVKALAP MGEEYVGLVK KGLESRWVDV YETPGKRSGA 
YSAGGKGMNP VMLLNFQGGL DDVYTLIHEM GHSLHTYFSS HNQEITYSDY SIFVAEVAST 
CNEALLSHYL LEHETDPARH AYILNHFLEG FRGTIYRQCM FAEFERDINQ MNADGVALNA 
EVLSERYGKL CAEYFGPGIE LDEEIKLEWS RIPHFYYNFY VYQYCIGFSA AIALSQRILS 
KGEPAVKDYI GYLSGGCSKT PIELLRGAGV DMATPDPVNA ALKYFGELVD QLEQELN