Gene Plim_1879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_1879
Symbol
ID	9138581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	2452948
End bp	2454336
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	56%
IMG OID
Product	sulfatase
Protein accession	YP_003629908
Protein GI	296122130
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGTTC TATTCGCGAC CTGTCTGCTA TTGCTGCCGA CCATTGGCGT CGCAGCCGAA 
CGTCCCAACA TTGTCTTCAT GCTTTCGGAT GATCAAGCCT GGAACGGTCT ATCGGTGGCG 
ATGCACCCCC AGCTAGCGGG CTCTAAGGGA GATATTTTTC ATACGCCAAA TCTGGAGAAA 
CTTGCGGTTC AAGGGATGCG GTTCTCAGCT GGATATGCGC CAGCTTCGGT CTGTTCTCCA 
ACCCGCATCA GTTTGATGAC CGGAAAAAGT CCAGCCGCGC TGCACTGGAC AAAGGCCGCT 
CCACCGGAGA CCGGGCACAA ATTGATAGAG CCACGAAACA TCCGCAGCAT CCCGGCGAAT 
GAAACTACGA TTGGTGATGT CCTGCGCCAG GCAGGTTACG CGACCGCTCA CTACGGCAAA 
TGGCATATTG GCGGCGGCGG TCCAGAACAG CACGGTTTTG ACAAATCGGA TGGTGACACC 
GGCAACGAGA ACGCCTATCA GTTCAAAGAC CCGAACCCCG TCGATATCTT CGGCATGGCC 
GATCGCGCGG CCGCGTTTAT GGATAGAAGT TCCAAGGCCA AGAAGCCGTT CTTCATTCAA 
CTCTCCTGGA ACGCATTGCA CGCCTCGGAG AATGCGAATC AGGCCACACT TGCCAAATAC 
GAGCGGCAAC TCAAAGGCGA GAACCGAAAA CGCATCACCA CAGCGGCGAT TACGGAAGAC 
CTTGATACGG GGGTGGGCCG TGTCCTGGAG GCTATTGACC AACTCGGCCT GACCGAAACA 
ACCTACGTGA TCTACATGGC TGATAACGGT GCTGGCGGTG GCAAAAAAGT TCTGGCCGGC 
GGTAAAGGGG GAGTGTGGGA AGGAGGGATT CGTGTTCCCT TCATCGTGCG TGGCCCAGGC 
GTAAAGCCGA ACTCGTGGTG TCACACTCGA GTGGTCGGTT ACGACCTCTT TCCCACCTTC 
TGCGAGTGGG CGGGGATCGC TCCCGGCAAG CTGCCGAAGG GAATCGAAGG AGGCAGTATC 
GCTTCACTGC TCAAGACCGA AGGTCGGGGA GACGTCAAGC GTTCGCGAGA GGAACTTGTC 
TTTCACTTTC CACACTATCA GGGGGATGCA CCGCACTCGG CGATCTTCCT TGGTGACCTG 
AAACTGTTGC ACTTCTACGA AGACAACCGC GACGAGTTGT ACGACCTCTC CAAAGACATC 
GGCGAGCGAG ATGACCTCGC AGGACAGCGC CCTGCCGAGA CGAAAAAGCT CCGTGAGCGT 
CTCGACAAAT ACCTTGCCCA AGTCGATGCG CAGTTCCCGA CACTGAACCC GAACTTCGAC 
CCCAATCAGC CAGTTGAACC GAAAAAACGT GGTGGGAAGA ACAAACCCGG GAAACCCGCA 
ACGAAATGA

Protein sequence

MRVLFATCLL LLPTIGVAAE RPNIVFMLSD DQAWNGLSVA MHPQLAGSKG DIFHTPNLEK 
LAVQGMRFSA GYAPASVCSP TRISLMTGKS PAALHWTKAA PPETGHKLIE PRNIRSIPAN 
ETTIGDVLRQ AGYATAHYGK WHIGGGGPEQ HGFDKSDGDT GNENAYQFKD PNPVDIFGMA 
DRAAAFMDRS SKAKKPFFIQ LSWNALHASE NANQATLAKY ERQLKGENRK RITTAAITED 
LDTGVGRVLE AIDQLGLTET TYVIYMADNG AGGGKKVLAG GKGGVWEGGI RVPFIVRGPG 
VKPNSWCHTR VVGYDLFPTF CEWAGIAPGK LPKGIEGGSI ASLLKTEGRG DVKRSREELV 
FHFPHYQGDA PHSAIFLGDL KLLHFYEDNR DELYDLSKDI GERDDLAGQR PAETKKLRER 
LDKYLAQVDA QFPTLNPNFD PNQPVEPKKR GGKNKPGKPA TK