Gene Plim_3689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3689
Symbol
ID	9140407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	4749311
End bp	4751395
Gene Length	2085 bp
Protein Length	694 aa
Translation table	11
GC content	56%
IMG OID
Product	Oligopeptidase A
Protein accession	YP_003631700
Protein GI	296123922
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGAAC TTCTCGACAA CCCTCTCCTG GTAACCAGCG GGTTACCAGA TTTTGCCCGG 
ATCGAAGCCT CACATGTCGT CCCGGCTGTG CGTGCGACTG TCGAGACCGC TCTCAAAAAA 
CTCGATGCCA TCGAATCCCA TCTGCAGCCA ACATGGGCTG GCATTATGTC CCCCATCGAA 
GAGATGGAAC GCCCCTTCAC CTGGAGTTGG GGCCCCGTGG GTCATCTCCT GGGTGTTCGC 
AACAGTCCCG AACTGCGAGC TGCCTATGAA GAGGTCAATC CTGAAGTCGT ACGCTATAGC 
CTGCGCGTCA GGCAAAGCGA ACCGATCTAT AAAGCCCTGG TGACTCTGGC CGAGTCGCCG 
GAGTGGGAGA GGCTTTCGCC GGCCCAGAAG CGGATCATTA AAGATCGCAT CAAGGATGCC 
GAACTGGCCG GGATTGGTCT GCAAGGCGAC GCGCGAAAGC GATTTGGCGA GATTGAAGAA 
AGGCTGGCTG TCCTTTCCAC ACAGTTCATG AACAACTGCC TCGATGAAAT CAAAGCTTTC 
TCACTCGATC TTACCACGGA AGAGGAAATC GCCGGGTTCA CTCCCACACT CAGGCATCTG 
ACGGCCCAAT CGTGGAATCG TGCTCACCCG GAAAGTGAAA CCAAAGCGAC CGCGGAGCAT 
GGTCCCTGGC GCATCACGCT CGATTTCCCG GTGTATGGCC CTTTCATGGA GCACGCGAAA 
AGGCGCGACT TACGCGAGAA GCTCTATCGG GCATTCATCA CTCTCGCTTC CCAGGGTGAA 
CACAACAATG AACCCATCAT GCGGGAACTG CTGAGCTTGC GCAAAGAGAA GGCGCACCTG 
CTGGGTAAGA ACTCGTTTGC GGAAGTCAGC CTGATGCGCA AGATGGCTCC CGGTGTGGAT 
GCCATTCGCC ACATGCTGCA TGAACTTCGC GATACAAGCT GGGGAGCAGC ACAACAGGAT 
CTCGCCGATC TGAAGGCGTT CAAAGTCTCC AGCGGCGATA CCGATGACAT CAAACCCTGG 
GATGTTCCCT TTTGGGCCGA ACGGCTGCGC GAAAGCCGGT ATTCGTTCAC CGACGAACAG 
ATTCGCCCCT ACTTCCCATT TGAACGTGTG CTTGAAGGAT TGTTCGGTCT GATTCATCGG 
CTCTTTGGTG TCACGATTGA ACAGGCGCAA GAACCCGTCT CGGTCTGGTG CAGCGATGTC 
CGCTTTTATC ATGTCCTCGA TGAGTCGGGC CAGAAGATGG CCGCCTTCTT TCTGGACCCT 
TACTCGCGAC CCGAAAACAA ACGGGCTGGT GCCTGGATGG ATACCTGCCT TTTGAGGCAG 
AAGGTTGGCG ATGAACTTCA GCTTCCCGTC GCGTATCTCG TTTGTAATCA AACCCCACCT 
GTGGGTGAGC GGCCCGCCCT CATGACCTTT CGCGAAGTGG AAACGCTATT CCACGAGTTT 
GGTCACGGTC TCCAGCACAT GCTGACCATC ATCGATCATC CCGATGCCTC GGGAATCAAC 
GGCGTCGAAT GGGATGCTGT CGAACTCCCC AGTCAGTTTA TGGAGAACTG GTGCTATCAC 
AAGCCGGTGC TGATGGGGAT GACTCGTCAC TACGAGACCG GGGCACCATT GCCAGAAGAT 
CTGTTCAACA AGATCGTCGC AGCTCGCACT TATCGCGCCG GGTCGATGAT GCTCAGGCAG 
CTTCTCTTTG GTCTGACGGA TCTCGAGTTG CACCACGATT ACGATCCTGC GGGAAGCGAG 
TCCCCTTTTG ATGTACAGCG CCGCATCAGC CAGACGTGCG CGGTCATTCC GCTCATCCCG 
GAAGATCGCT CGCTGTGCTC ATTCCAGCAT ATTTTTTCGG GCGGCTACGC AGCGGGATAC 
TACAGCTACA AGTGGGCCGA AGTTCTCTCA GCCGATGCCT TCAGTGCTTT TGAAGAGGCG 
GGTCTTGATG ATGACAAGGC CATTGAACAG GTGGGCCGCC GCTTCCGCAA TACAGTGCTG 
TCGATGGGCG GCAGCCGACA TCCGATGGAA GTCTTCCGCG ATTTCCGTGG TCGCGAACCG 
AGCCCTGAAG CACTTCTCAG ACACATGGGT CTGACAAAAG TGTGA

Protein sequence

MAELLDNPLL VTSGLPDFAR IEASHVVPAV RATVETALKK LDAIESHLQP TWAGIMSPIE 
EMERPFTWSW GPVGHLLGVR NSPELRAAYE EVNPEVVRYS LRVRQSEPIY KALVTLAESP 
EWERLSPAQK RIIKDRIKDA ELAGIGLQGD ARKRFGEIEE RLAVLSTQFM NNCLDEIKAF 
SLDLTTEEEI AGFTPTLRHL TAQSWNRAHP ESETKATAEH GPWRITLDFP VYGPFMEHAK 
RRDLREKLYR AFITLASQGE HNNEPIMREL LSLRKEKAHL LGKNSFAEVS LMRKMAPGVD 
AIRHMLHELR DTSWGAAQQD LADLKAFKVS SGDTDDIKPW DVPFWAERLR ESRYSFTDEQ 
IRPYFPFERV LEGLFGLIHR LFGVTIEQAQ EPVSVWCSDV RFYHVLDESG QKMAAFFLDP 
YSRPENKRAG AWMDTCLLRQ KVGDELQLPV AYLVCNQTPP VGERPALMTF REVETLFHEF 
GHGLQHMLTI IDHPDASGIN GVEWDAVELP SQFMENWCYH KPVLMGMTRH YETGAPLPED 
LFNKIVAART YRAGSMMLRQ LLFGLTDLEL HHDYDPAGSE SPFDVQRRIS QTCAVIPLIP 
EDRSLCSFQH IFSGGYAAGY YSYKWAEVLS ADAFSAFEEA GLDDDKAIEQ VGRRFRNTVL 
SMGGSRHPME VFRDFRGREP SPEALLRHMG LTKV