Gene Plim_2292 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_2292
Symbol
ID	9138997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	2957695
End bp	2959164
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	54%
IMG OID
Product	sulfatase
Protein accession	YP_003630317
Protein GI	296122539
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACGAC TTTGGCCAGT CTGGGCAATT TGTCTTGCGA TCTTTCCAGC CACGAGCCTG 
ATTCTGGCAT GTGAGAAGCC AGTTGTGACC AGTCCTGCCC TCACAGTTTC TCCAGCCCAT 
CCACATATCA TTGTGATTGT CGTTGATGAC ATGGGTTTGG GAGATCTCGG ATGCTATGGT 
GGCAAGATTC AACCCACACC TGCACTCGAT CAGCTTGCCA GCGAAGGGAA GAGGTGGACG 
CAGTTTTACT CTGCCTCCTG CATCTGTTCT CCCTCTCGTG CGGCTCTGGT CACTGGTCGC 
TATCCCGGTC GGCATAAGAT TACCAGTTAT CTTCAGACAA GAGCCGGAAA CAAGGCTTGC 
GGGCAAGCCG ATTTTTTGAG CCCTACAGCT CCTTCCATGG CGAGAATTTT CAAATCGATC 
GGGTATCGAA CCTGCCATTT GGGAAAATGG CATTTAGGTG GTGGTCGAGA TGTGACCAAT 
GCTCCCAAGT TCGCGGCGTA TGGCTACGAC CATGCCCAAG GGACATGGGA AAGCCCGGAA 
CCTGCCACTC CTCTGGGAAA GCAGTATCCA CCGTGGTCAG AACAGTTAGA GCCGGGTCAG 
GTGCACCGTT CCCGACGAAC ACACTGGCTG GTTGATCAGA CTATGGAGTT TCTGAAAAAA 
GATCCTCAAC AGCCGGCTCT CATTACTCTC TGGCTGGATG ATGTCCATGT TCCTTTCAGG 
CCCAGCCAGG AGCAGTTATC TGCTCTACAG CAGGGCGCTA CTCCTGCCAG GGAAGTGACG 
GAGCGTGATC GCTATCGAGC CGTGATGGCG AATCTTGATC AGCAGATGGG ACGATTGATC 
GAAGCGATTC GCCAGAATTC CATGGCCGAA AAGACACTGG TGGTCTTTAT GGGTGACAAT 
GGACCGCTGC CCACCTTTGA TCAGGAACGG ACCGGAGGGT TACGCGGCTC CAAACTCAGT 
TTGTATGAAG GGGGAATTCG AGTGCCTTTC ATCGTCTGGC AGCCTGGAAG AATTCCTGCC 
GGTGCAGTGG ATGATCGAAC GGTTCTGACC AGTCTCGATC TGCTTCCTAC ATTACTTGCC 
TATGCCGGAG GAAGCACTGG CGAGCAGTTG CTGGCCTCCA ATTCCTGGAA GCTCGATGGA 
CACAATTGCT CAGGGAGTTT CACACAGGCG ACGGCAGGAC CAGTGATTGA AGAGCAGCAG 
CTACGAGCAG ATTTCTGGGA ATACGGACGT AAGTCCGAAG CGTTCGCCTT CCCGAAAGAT 
GCAGCCAATC GCAGTCCATT CCTGGCCATG CGTGAAGGCC CATGGAAACT TCTAGTCGAT 
CACGAGGGGC AGCATGCGGA ACTTTATCAG CTTGAACTCG ATCCGCAGGA AACAACCAAC 
CGGGCATCGG CAGATCAGGC CCGTGTGGCA GCGATGACTC GCCGATTGCT CACGTGGTAC 
AAGGATGTCT ACCAAGTACC AACTCCATAA

Protein sequence

MQRLWPVWAI CLAIFPATSL ILACEKPVVT SPALTVSPAH PHIIVIVVDD MGLGDLGCYG 
GKIQPTPALD QLASEGKRWT QFYSASCICS PSRAALVTGR YPGRHKITSY LQTRAGNKAC 
GQADFLSPTA PSMARIFKSI GYRTCHLGKW HLGGGRDVTN APKFAAYGYD HAQGTWESPE 
PATPLGKQYP PWSEQLEPGQ VHRSRRTHWL VDQTMEFLKK DPQQPALITL WLDDVHVPFR 
PSQEQLSALQ QGATPAREVT ERDRYRAVMA NLDQQMGRLI EAIRQNSMAE KTLVVFMGDN 
GPLPTFDQER TGGLRGSKLS LYEGGIRVPF IVWQPGRIPA GAVDDRTVLT SLDLLPTLLA 
YAGGSTGEQL LASNSWKLDG HNCSGSFTQA TAGPVIEEQQ LRADFWEYGR KSEAFAFPKD 
AANRSPFLAM REGPWKLLVD HEGQHAELYQ LELDPQETTN RASADQARVA AMTRRLLTWY 
KDVYQVPTP