Gene Plim_1565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_1565
Symbol
ID	9138265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	2015483
End bp	2016844
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	58%
IMG OID
Product	sulfatase
Protein accession	YP_003629597
Protein GI	296121819
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.717098
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCTGCG GCGATCTCCT CGCGGCCGAG ACTCCTGCTC AGCCGCTGAA CATTGTGGTG 
CTTTACGCCG ATGACTGGCG TTTTGATTCC CTCGGCTGCG CCGGCAACCC CATTATCCAG 
ACACCCCACA TCGACGCCCT TGCGGCCAAG GGCGTTCGCT TTCCGCGTAA TGCCGTCACC 
ACCTCCATCT GCGGCGTCTC CCGCGCCACG CTCCTCACTG GCCAATGGAT GTCGCGTCAC 
GGCAACCCGG CCTTCGAGAT GTTCAAAACC CCCTGGGCCG AAACGTATCC CGCGATCCTT 
CGTGAACGGG GCTATCACGT GGCCCATGTC GGCAAGTGGC ACAACGGCAA GTTCCCCGCC 
GCCAACTACG ATTACAGCCG CATCTCAGCC ACGAGGCACT GGGTTCCCGC TCGGGGCGAG 
GCCGGTAAGA AAGGCGAGAA GGTTCATATC ACCGCCCTGC AGGAACAGGA CGCCCTCGAC 
TTCTTCGACA GCCGTTCCAA GGAAAAACCC TTCTGCCTGA CGGTCGCCTT CTTCGCCCCT 
CACGCCGATG ACCCTTCACC CGCACAATAC TTGCCGCAAC CGAAAAGCAT GTCGCTGTAT 
GTCAATGACA TCATTCCAGT ACCTGCGACA GCGAACGAGC AGGCTTTTCG AAATTTGCCA 
CCCTTCCTGG CGAACGACAA GCAGGAGGGC CGCCGTCGCT GGTCGTTAAG GTTCTCGACG 
GATGAAGCCT TCCAGACGTC GATGAAAAAC TACTACCGGC TCATCACCGA AGTCGATGCT 
GCCTGCGGCC GCATTCTGGA TCGATTGAAT GCGGAGGGGT TGGCGGACAA CACGCTCATC 
CTCTTCACCA CGGACAACGG CTATTTCCAC GCCGAAAAAG GCTTGGCTGA TAAGTGGTAT 
CCTTACGAAG AAAGTATCCG CGTGCCGCTG GTAATCGTCG ATCCCCGGAT GGACAAATCG 
CTGGCGGGAA TGACGAATAA TGCCCAGACA CTGAACGTCG ATCTCGCGCC GACGATCCTT 
CGCGCCGCCG GTGCCCAGCC CACCCCGCGG ATGCAGGGCC AGGACATGTC ACCCCTCTAT 
CTGGGAACGC CCGCTTCAAG ACAGGCAGCC GCCAAAAGTT GGCGAACCGA CTTCTTCTAC 
GAGCATTCGG CTATCCGTGA CATTTCGTTT ATCCCTTCAT CGCAGGCTCT CGTGACGCCC 
GAGTGGAAGT ACCTGTATTG GCCAGACTTT CAGCGGGAAG AACTCTTTCA TCTCACCACT 
GATCCTCGCG AAGAACACGA CTTGGCCGGA GATGAAAAAT CTCTCGACAC TTTACGTGAT 
CTCCGTGAGC GCTTCGCGAA GCTAAGAAAT CTCGCCAGGT AA

Protein sequence

MICGDLLAAE TPAQPLNIVV LYADDWRFDS LGCAGNPIIQ TPHIDALAAK GVRFPRNAVT 
TSICGVSRAT LLTGQWMSRH GNPAFEMFKT PWAETYPAIL RERGYHVAHV GKWHNGKFPA 
ANYDYSRISA TRHWVPARGE AGKKGEKVHI TALQEQDALD FFDSRSKEKP FCLTVAFFAP 
HADDPSPAQY LPQPKSMSLY VNDIIPVPAT ANEQAFRNLP PFLANDKQEG RRRWSLRFST 
DEAFQTSMKN YYRLITEVDA ACGRILDRLN AEGLADNTLI LFTTDNGYFH AEKGLADKWY 
PYEESIRVPL VIVDPRMDKS LAGMTNNAQT LNVDLAPTIL RAAGAQPTPR MQGQDMSPLY 
LGTPASRQAA AKSWRTDFFY EHSAIRDISF IPSSQALVTP EWKYLYWPDF QREELFHLTT 
DPREEHDLAG DEKSLDTLRD LRERFAKLRN LAR