Gene Plim_3949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3949
Symbol
ID	9140668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	5072123
End bp	5073535
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	54%
IMG OID
Product	sulfatase
Protein accession	YP_003631959
Protein GI	296124181
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.184377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTCTGC GTAACGGCTT CCATTTCTCT TCGATCTGTC TCGTGGGGAT CTGCCTGGCA 
GGAATTTCTT CGATCTGCGA TCTGGCACAA GGGGCTGAGC CAACTCAGAC CTCCCGGAAG 
CCGAATGTCA TCATCTTCTA CGCGGATGAC CTCGGATGGG GAGAAACCGG GATTCAAGGA 
AATCCACAGA TTCCCACGCC TCACATCGAT TCAATCGCCA AAAATGGGGT GCGATGCACT 
CAAGGCTTTG TCGCAGCGAC CTACTGCAGT CCTTCGCGAG CCGGCTTGTT GACCGGCCGC 
TATCCCACAC GCTTCGGCCA TGAGTTTAAT CGGATTGCCA ATGTCTCTGG CCTCGATCTT 
CAGGAAACAA CTCTGGCTGA TCGCCTGCAT GGCTTAGGCT ACAAAACTGC CTGTGTCGGC 
AAATGGCACC TGGGAGACGG CCCGGAATAT CGACCAACAA AACGAGGTTT TGACGAGTTC 
TTCGGCACAC TCGCGAACAC CCCGTTTTTT CATCCCACCA AGTTTGTCGA TTCCCGAGTC 
TCGAATGATG TCGCAGAAGT CTCCGACGAA AACTTTTACA CCACAGACGA ATACGCCAAA 
CGCTCAGTGG AGTGGATTGG ACAGCAACAG CAGTCTCCCT GGTTTTTGTA TCTTCCGTTC 
AATGCACAGC ATGCTCCACT GCAGGCTCCA CAGAAGTATC TGGATCGCTT TGAATCGATC 
GCAGATCCCA AGCGTAAGCT CTTCGCAGCC ATGATGTCCG CCATGGATGA CGCCATTGGT 
CAGGTGCTGG GCAAGGTGCG AGAACTCGGG CAGGAAGAAA ACACACTGGT CTTCTTCATT 
TCCGACAATG GGGGCCCGAC CCAAGGCACG ACATCTCAGA ATGGCCCCTT GCGCGGCTTC 
AAAATGACCA CCTTCGAAGG GGGAACACGC GTGCCGTTCC TCGTTCAATG GAAAGGTAAG 
CTCCCCGCTG GAAAAACTTA CGACAATCCT GTCATCAACC TGGATGTTCT GCCGACCGTG 
CTCACCGCAG CAGGGAGCAA AATCGATCCC GCCTGGAAGC TGGATGGTGT TGATCTGGTG 
CCTTATTTTA CAAGTTCCAT CGCAAACAAG CCCCACGAAA CCTTGTACTG GCGATTTGGT 
GAGCAATGGG CTGTTCGCCA GGGCGATTGG AAGCTGGTTG TCGCCCGCGG AGGGAGTGGA 
CAGCCCGAAC TCTACGATCT GGCGAGTGAT ATTGCCGAGT CGAAAAATCT CGCTTCAGAA 
AACCCCGCCA AGGTCAAAGA ATTGCAGGCA CTATGGGATC AATGGAGTCA CGAACAGGCT 
GCTCCCAAAG TTGTTGACCA GCCCAATAAC GCCAAGAAGG CAGGAAACAA AAAAGGCGCC 
AAGAAGAAAG CCGCAGCCGG TTCCGCCACT TAG

Protein sequence

MVLRNGFHFS SICLVGICLA GISSICDLAQ GAEPTQTSRK PNVIIFYADD LGWGETGIQG 
NPQIPTPHID SIAKNGVRCT QGFVAATYCS PSRAGLLTGR YPTRFGHEFN RIANVSGLDL 
QETTLADRLH GLGYKTACVG KWHLGDGPEY RPTKRGFDEF FGTLANTPFF HPTKFVDSRV 
SNDVAEVSDE NFYTTDEYAK RSVEWIGQQQ QSPWFLYLPF NAQHAPLQAP QKYLDRFESI 
ADPKRKLFAA MMSAMDDAIG QVLGKVRELG QEENTLVFFI SDNGGPTQGT TSQNGPLRGF 
KMTTFEGGTR VPFLVQWKGK LPAGKTYDNP VINLDVLPTV LTAAGSKIDP AWKLDGVDLV 
PYFTSSIANK PHETLYWRFG EQWAVRQGDW KLVVARGGSG QPELYDLASD IAESKNLASE 
NPAKVKELQA LWDQWSHEQA APKVVDQPNN AKKAGNKKGA KKKAAAGSAT