Gene Plim_4229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_4229
Symbol
ID	9140951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5403072
End bp	5404265
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	53%
IMG OID
Product	peptidase M20
Protein accession	YP_003632236
Protein GI	296124458
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.543782
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGGAC TCGGTGCACG GGCGTTAGAA CTGGCGATGC AACTGATTCG CATCCCGACG 
GTCAGCCGAG ACAGTAATCA TGCCGCGACG TTGTTTCTAG AAAACTGGTT GAAAGAGCAT 
GGCTTTATCA CGGAAGTTCT CACATACCAC GATTTTAAAG GTGTTTTGAA ATCGAGTGTG 
ATCGGACGAA GAGGCCCCGC AAAATCGACG GGTGGCGTGG CCTACTTCTG CCACACCGAT 
GTGGTTCCTG CCGAAGGATG GGTGGGCCTT AAAGAGAGTG ATTCTCTACA GGGCCCGACT 
CAACCACAAC AACCTTTTAC ACCCGTCGTC ATGGGTGACC GCCTGTATGG GCGTGGTGCC 
TGTGATATGA AAGGTTCAGC CGCCGCTTTT CTCGCAGCGA TTGAGCAATG CCCTGTCGAG 
GAACAGGCAG CACCGATTTA TGTGGTCGCC ACAGCTGATG AAGAAGTGGG ATTCTATGGA 
GCCGCCGATG TGGCTGCTCG ATCACAACTT TATCGACAAC TCGTGGACGA AAAAGTGGCT 
GGCATTATTG GTGAACCCAC CGAGCTGAGT GTGGTTCACG CACATAAGGG GATGTACGTT 
CTCAAGGCAA CCTCTTCAGG CAGAGCCGCC CATTCGAGCA CACGCGAAGG TCTCAATGCC 
AATCTGGCGA TGATCGATTT TCTGTATGAA ATGAAGCGAT TGCATGACCA GACACTGACT 
GATCCAGCCT GGCTCGATGC ACGCTTCGAT CCACCCTGGA TCAGTTGGAA CATAGGGATT 
AACGACTTCA CGCATGTGGT GAATATGACG CCCGCACAAA GTGTCTGTAC GGTCTCGTTT 
CGTCCCATGC CGGATCAGCA GCCGGATGAA CTGGTGGCGC AGGTCGAACA GATTGCGGCT 
GCCTGTGGAC TGACGTTTGA AGTCATTCGC CGCGGACAAC CACTCTATCT CGACCCGGAA 
TCGCCCTTTG TCAAAACGAT GTGCGAGCTT TCGGGGTCAG GATCATCGCA GACAGTCAGT 
TACGGTACTG ATGGCACGAT GTTTACAGAA ATCGAACAGA TGATCGTCCT GGGCCCGGGT 
TCGATTCGAC AGGCACATAC TGCCGATGAA TTTATCACTT TAGAGCAACT ACAAAGCGGG 
GCCGAACTTT ACAGCCGAAT TATCCGGCAA CTGGTCTCAA ACCAGAGTGA GTGA

Protein sequence

MNGLGARALE LAMQLIRIPT VSRDSNHAAT LFLENWLKEH GFITEVLTYH DFKGVLKSSV 
IGRRGPAKST GGVAYFCHTD VVPAEGWVGL KESDSLQGPT QPQQPFTPVV MGDRLYGRGA 
CDMKGSAAAF LAAIEQCPVE EQAAPIYVVA TADEEVGFYG AADVAARSQL YRQLVDEKVA 
GIIGEPTELS VVHAHKGMYV LKATSSGRAA HSSTREGLNA NLAMIDFLYE MKRLHDQTLT 
DPAWLDARFD PPWISWNIGI NDFTHVVNMT PAQSVCTVSF RPMPDQQPDE LVAQVEQIAA 
ACGLTFEVIR RGQPLYLDPE SPFVKTMCEL SGSGSSQTVS YGTDGTMFTE IEQMIVLGPG 
SIRQAHTADE FITLEQLQSG AELYSRIIRQ LVSNQSE