Gene Plim_2089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_2089
Symbol
ID	9138792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	2710862
End bp	2712208
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	53%
IMG OID
Product	protein of unknown function DUF1501
Protein accession	YP_003630115
Protein GI	296122337
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.488843
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCAT TTTTGAATCG TCGTGATTTC AACCAGTACA CTGCACTGGG TGGGGCAGCA 
GCTTTATCGG CAGGGTTACC CTTTGGATTG TCAGCAGGAA TACAAGGGGT TGGATCTGCG 
TCTTCTCTAT TGGCTGAGGA GCATGCAAAA GTCAGCTTTC CGATGGGGAA AGCCGAGCAT 
TGTGTCATGA TCTGGCTCGG TGGTGGAGCC GGTCAGATCG ATACCTGGGA TCCCAAAGTG 
AAAGGCGATC CCAAAGCGAA TAAAGCGGGT TCGTATTATG GCAAGATTCA GACGGCTATC 
CCAGGGGTGG AAGTCTGCGA ACACCTCTCG CGCTGTGCAC CGATCATGGA TCGATTCACA 
TTATTTCGAA CCGTGCATCA CGATGTGATT GACGAGCATG CGGCAGCGAC GAATCGTATG 
CATACAGGCC GCCCTGTCAG TGAAACGGTG ATTTACCCTT CGGTCGGTTC TGTCATTGCT 
CATCAGCGTG GTGCGGCAGG TGATGGTGTG CCTGCGTATG TTCTCATTGG GTATCCCAGC 
ACGACGAGAG GCCCGGGATT TCTGGGCAGC AAAGGGAACT ATGTCTATCT GACAGATACC 
GAAAGTGGCC CCCAGGGCTT TCAGCCAGCT TCGGTGATTC GCCAGGAGCG GCAAGCACGT 
CGTAACGAAT TGCTGAAGAA AGTTCGCCAG CTCAATACCA CTGAAGAAAA ACAGGCTTTA 
CTGAAAAATT ACGAGTCGAT GATTGATGAA GCTCAGCGGC TGGCTGGCCC GCAGTTCATG 
CGGATCTTTG ATTTGAAATC CGAATCTGCC GACCTTCGTA ATGAATATGG TGGCGAGTTT 
GGGCAGCGCT GCCTGCTGAC CCGCCGCTTA CTGCAGTCAG GGGTGCGGTT TGTCGAAGTC 
TCGCATAACT TGAACTTTCT CAACGGTACT GGCTGGGATG TCCATAATGA TGGGATCGTC 
CAGCAGCATC GACTGATTCA GGAACTCGAT CAGGCGCTCG CAGCCCTCGT GCTCGACCTG 
GAGCGAAACA AACTTCTCGA TAAAACGTTG ATTGTGGTTT CAACAGAGTT TGGACGACCT 
GCCAAATTCG ATGGTGGCGG CGGGCGCGGG CATCATGGCA AATGCTTTTC GGTCGCTTGT 
GCAGGTGGCG GGATCAAGAC CGGCGTGGCG ATTGGTGAGA CTGATGATCT GGCGATGAAC 
ATCGTCACTA GACCAGTTTC CGTACCCGAC CTGCATGCCA CCATGTACGC AGTATGTGGC 
GTGAATCCTC GGGAAGAACT GTATGCAGGT GAGCGTCCTG TTCCTATTAC AGATGGTGGT 
ACCCCCGTGC TGGAACTCTT CTCGTGA

Protein sequence

MNPFLNRRDF NQYTALGGAA ALSAGLPFGL SAGIQGVGSA SSLLAEEHAK VSFPMGKAEH 
CVMIWLGGGA GQIDTWDPKV KGDPKANKAG SYYGKIQTAI PGVEVCEHLS RCAPIMDRFT 
LFRTVHHDVI DEHAAATNRM HTGRPVSETV IYPSVGSVIA HQRGAAGDGV PAYVLIGYPS 
TTRGPGFLGS KGNYVYLTDT ESGPQGFQPA SVIRQERQAR RNELLKKVRQ LNTTEEKQAL 
LKNYESMIDE AQRLAGPQFM RIFDLKSESA DLRNEYGGEF GQRCLLTRRL LQSGVRFVEV 
SHNLNFLNGT GWDVHNDGIV QQHRLIQELD QALAALVLDL ERNKLLDKTL IVVSTEFGRP 
AKFDGGGGRG HHGKCFSVAC AGGGIKTGVA IGETDDLAMN IVTRPVSVPD LHATMYAVCG 
VNPREELYAG ERPVPITDGG TPVLELFS