Gene Plim_0142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_0142
Symbol
ID	9136796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	191177
End bp	192547
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	59%
IMG OID
Product	protein of unknown function DUF323
Protein accession	YP_003628193
Protein GI	296120415
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.741056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATGGC TTATCGAACA GGCTGGTTCA ACAAATCCCA CTGATTCCGC CGCACGAGTT 
GCGAACGGCT GGCAAGGAAT CAGGCTGTGC GCCCTCCTGT GGCTGGCCCC CTGGTTGCTG 
TCAGGTTGTG GTGGTGGCAC AAAACCACCA GCACCAGCAG CTCCGGTGGC TCCACCACCT 
GTCGCCATCA AAACGGTGAA GCCCGCTGCT CCTGAACCCG CTGAGAATCC GCCGGGCGAA 
GCCGCACCCG TCGAAGGCGA AGCCACAGCC GGCCCGGCCA TGGCTCCACC GGGAGAACAT 
CCCGCAAATG TGTTTGACTT CGTCGCACCT GGCTCTGTCA ACAGCGTGAC ATCATCAACA 
CCACTTCCGC ATGAAATCGA TCAGTTTGTG ATTGCACAGG TGGCAGATCA GGCAGGTGCA 
ACCAGCTTTG TCGTGACCGA AATTCCCGCC ACCACCGAGA CGGGAAGCTC GATCGATGCT 
TCGGGAAACC CTGCGAACCT CCAGGGAAAT CGTTTACCAA TTGGGTTCAT GTCCGTTCCG 
GGGACAGGGT TATCGCCGGA TGGCTGGCCT AAGCGAATCA TCTGCCAGTA CGACGGCAGC 
CTGATGGCCT ACATCCCACC CGGGCCTGCC AGGCTCGGCT CCAATGACGG CCCCGCCAAT 
GCCCGGCCTG AAGCCACGGT TCTACTGGAT GGCTATTACA TCAATGTGTT TGAAACAACG 
GTCGCTGAGT ACAAACGCTA TCGCGATGAG ATGAAGGCCA AGAACAAGAA CAGCTTCGCT 
GCGATCAATG AGACGGCTGA TCCACGCCAG CCCGTACTGG GGATTCCGTG GGGTGTGGCC 
AGTGCCTACG CCAAGTGGTC TGGTCGGGAA CTTCCCACAG AGGCGGAATT TGAAAAAGCC 
GCCCGTGGCC CGGACGGATT TCGAGCTCCC TGGGGCAATA CCCGGGCGAT CTGGCCCGAG 
CCGCGAACGA CCAAAACATT GGCCAACGTC GGCAAGTTCA GCAGCGATCA GAGCATTTAC 
GGCATCTACG ACCTGGCGGG AAATGCTCAT GAATGGGTCG CCGACTGGCA CGACGACAAC 
AGCCACGCCG AAGCGGCCAA GTCGCGAGAC GGCGTGAAGA ACTGGACAGG TGCCAAGAAG 
CCAAAAATTA CCAGCCAGCA CACCGTGAAA GGCTGTTTAA GCGATTGGGA TGTCACAGCC 
CGGGAAGGTC GATTGATGAC CGACAAATTC CCCGATGTCG GTTTCCGCAC AGTCCTGCGC 
GTTGGAGGGG GAAATCCCGG ACAACCTGCA GCCACTCCTC CCAACACACC CAACACGAAG 
CCCGCAAACC CCAACCGCCC CCCCAATCCA CCACGCAACA ACGCATTTTA G

Protein sequence

MAWLIEQAGS TNPTDSAARV ANGWQGIRLC ALLWLAPWLL SGCGGGTKPP APAAPVAPPP 
VAIKTVKPAA PEPAENPPGE AAPVEGEATA GPAMAPPGEH PANVFDFVAP GSVNSVTSST 
PLPHEIDQFV IAQVADQAGA TSFVVTEIPA TTETGSSIDA SGNPANLQGN RLPIGFMSVP 
GTGLSPDGWP KRIICQYDGS LMAYIPPGPA RLGSNDGPAN ARPEATVLLD GYYINVFETT 
VAEYKRYRDE MKAKNKNSFA AINETADPRQ PVLGIPWGVA SAYAKWSGRE LPTEAEFEKA 
ARGPDGFRAP WGNTRAIWPE PRTTKTLANV GKFSSDQSIY GIYDLAGNAH EWVADWHDDN 
SHAEAAKSRD GVKNWTGAKK PKITSQHTVK GCLSDWDVTA REGRLMTDKF PDVGFRTVLR 
VGGGNPGQPA ATPPNTPNTK PANPNRPPNP PRNNAF