Gene Plim_4054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_4054
Symbol
ID	9140774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5205947
End bp	5208076
Gene Length	2130 bp
Protein Length	709 aa
Translation table	11
GC content	53%
IMG OID
Product	protein of unknown function DUF87
Protein accession	YP_003632064
Protein GI	296124286
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0459328
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAACTT CACCAGTCGA ACATCTCTCT GGCCTCGTAG TCGGTGTCGT AGAGTCAGTT 
GCTCCTGATC AAGTGCGGGT GATGCTTGAA CTCGACACTC CGCACACGAC GGCATTGAAC 
ACTGGGTCGC CTGTCGCGTT TCCGCGCCTG AACGGTTATG TGCTGATTCC CCATGAAGCG 
GGGGCGACGG TTGCTTACAT TTCCTGGATA GGAATTGAGC GTTCACCATT CCCGAAACGA 
TCTGGCCTCA AGGACTTTGG CTTGATCGAC CTTCCATTTC CGTTGCGAAA AATGGCAGTT 
TCACCAGTCG CAACGCTGAC ATGCAAACGC GACAAGACCT CGCGCACCCA GTATGTGCTC 
TCCCGTGGCG TTGTCGCCTT TCCCTCTGTC GGGGATCAGG TGTTGATTCC CACTGCCGAA 
CAAATTGAAG CAATCGTTGG GGCGAAGGAT ACGGATAGGC GCGTCAAGAT CGGCGTGTCG 
CCCCTCGGGG CAAGTACGAA AATCATGGTC GACCCAGACA AGCTGTTCGG GCGGCACCTC 
GCGGTGCTGG GGAATACCGG TAGCGGGAAG TCATGCACGG TTGCCGGATT GATTCGCTGG 
TCGATGGATG CAGCCAAAAA GCAGATGTCC GAAACCGGCA AGACGGGACG TCCCAATGCC 
CGCTTTATCG TTCTCGATCC TAACGCTGAA TACTCGAATG CTTTTCGGGA CGACCCTCAA 
AATGTCCGTC TTTTTAAAGT TCCGCCAGTC TCCGGAGATG ATCGTGCTTT GCAGGTGCCA 
GCCTGGATGT GGTGCGGACA TGAATGGACG GCCATTTCCA ACGCTCAACC CGGTGCCCAA 
CGGCCTTTGT TGATGCAAGG GTTAAGAGAT TTGAAGAGTG GCTCTGTTTC GCGGGGATCG 
CGTGAAGCAA TATTACGACG CTATGTGATC TCTTACATGG TGCGAGTTTC GGAGATGTTG 
AGCCGTGGGA CCATAGCGTT TGCTGGTTCT CCTCGACCTC GTTTTGAATG CGCTGGTTTG 
CTGAATGGGA TAGCGAAGGA CTGTCAAGCA TGGTCGGGTG ATCTTGAAGG TCAAGCACAA 
ACGTTAATGC AGAACGCTGC TTCGGCTGCA TTACAAATCG AGCAATCTAG GAAATCGGGC 
CAATACTACA ACGACTTCCT CGTATCAGAC TTGGAGAGTA TTCGATCTTC GCTAGAGGAT 
TGTGCAAAAG TATTGCCCGA TGTTGCTCCG GAAGGGCCTA TCAGCGAAGA CTCGCCAAGC 
TACTTCGACG TGAATATTCT CGCTGACCAT CTTGAACGTA TAGCCGTTGA GCAAGGTGCC 
GGTGTGGCGG GCTTCGTTGC GACTCTCGGT TTGCGTATTC GAGCAATGTT GGCGGATCAG 
CATCTCGGGG CTGTCGTCAA TGGAAATCCT ACGTTTGAGG CGTGGCTTGA AGAGTATGTG 
GGGGCAGATA ATGCGTCGAA TGGAAATGTG GCGATCATTG ATCTTTCTCT CATCCCAAGT 
GAAGTTGTCC ATATCGTAGT CGCCGTGTTG GGCCGACTTG TGTTTGAGTC ACTTCAGCGT 
TATCGGCGCG ATAATGCCGC CGGTGAGTCA CTTCCGACCG TCCTAGTACT TGAAGAGGCG 
CATACATTCG TGCGTAAAGG GCATGAAGAA TCCTCCGGCA CGGCAACAGC TACTGCACTA 
TGTCGGGAGA CATTTGAGAA AATTGCCCGC GAAGGACGCA AGTTCGGACT CGGACTCGTT 
GTGTCGTCAC AAAGGCCCTC AGAATTGTCA GCTACCGTCC TGGCGCAGTG CAACACATTC 
ATTTTGCATC GCATCGTAAA TGATGCTGAC CAGCACCTCG TTGGCAAGCT TGTGCCTGAC 
AATGTCGCAG GATTGTTGGC CGAGCTTCCA AGTCTGCCCT CGCGTCAAGC GATTTTGCTT 
GGCTGGGCAA CACCAATTCC GATTCTTGTA GAAATTGACG AGTTGCGCGC GGATCAGCGG 
CCACATTCAT CTGACCCTGA TTTCTGGGAT GTATGGACGC ACGAAAAGCC TCGCGATTTG 
GATTGGAAAG AAGTGGTTGG GGACTGGGTA GGACAGGTCA AAGTCGATGA AACTGAAGAT 
GGAGAGTTGC TAGAAAATGT AGGCGAGTGA

Protein sequence

MATSPVEHLS GLVVGVVESV APDQVRVMLE LDTPHTTALN TGSPVAFPRL NGYVLIPHEA 
GATVAYISWI GIERSPFPKR SGLKDFGLID LPFPLRKMAV SPVATLTCKR DKTSRTQYVL 
SRGVVAFPSV GDQVLIPTAE QIEAIVGAKD TDRRVKIGVS PLGASTKIMV DPDKLFGRHL 
AVLGNTGSGK SCTVAGLIRW SMDAAKKQMS ETGKTGRPNA RFIVLDPNAE YSNAFRDDPQ 
NVRLFKVPPV SGDDRALQVP AWMWCGHEWT AISNAQPGAQ RPLLMQGLRD LKSGSVSRGS 
REAILRRYVI SYMVRVSEML SRGTIAFAGS PRPRFECAGL LNGIAKDCQA WSGDLEGQAQ 
TLMQNAASAA LQIEQSRKSG QYYNDFLVSD LESIRSSLED CAKVLPDVAP EGPISEDSPS 
YFDVNILADH LERIAVEQGA GVAGFVATLG LRIRAMLADQ HLGAVVNGNP TFEAWLEEYV 
GADNASNGNV AIIDLSLIPS EVVHIVVAVL GRLVFESLQR YRRDNAAGES LPTVLVLEEA 
HTFVRKGHEE SSGTATATAL CRETFEKIAR EGRKFGLGLV VSSQRPSELS ATVLAQCNTF 
ILHRIVNDAD QHLVGKLVPD NVAGLLAELP SLPSRQAILL GWATPIPILV EIDELRADQR 
PHSSDPDFWD VWTHEKPRDL DWKEVVGDWV GQVKVDETED GELLENVGE