Gene Plim_2374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_2374
Symbol
ID	9139085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	3095343
End bp	3097751
Gene Length	2409 bp
Protein Length	802 aa
Translation table	11
GC content	59%
IMG OID
Product	sulfatase
Protein accession	YP_003630399
Protein GI	296122621
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACAGC GAACAATGAC CAACACCGTG GTCGCCCTCA TCTGCGGCAT GCTTGGGAGC 
GGCCTGGGGA TGTGCGGCAC ACTCACCGAC GTACTTGGTC AAAACAAGGC GCGTCCAGCG 
CAGGTAGAAG GTACTGTCCT GCCGTTTCCG CCGGCTCCGA CTGCCAGTAA GGCGGGGCCA 
ACGCTGCAAG AATCCATCCA TAAGCGTCGC ATCGAGCCGA ATCGGTTGCC GAAAGGCGCG 
CCGAACGTGC TGATCGTACT CATCGACGAC GCCGGGTTCG GCGTGCCGGA CACCTTCGGT 
GGTTTCGCGC ACACGCCGAC GCTGTCGAGA TTGCGTGACG AGGGCATCAG TTACAACCGC 
TTCCATACCA CATCGATCTG CTCGCCGACC CGTGCTGCTT TGCTCACCGG TCGTAATCAC 
CAGCGAGTTG GAAATGGCAC CATCGCCGAG CGTGCGGTGG ATTGGGACGG TTACACCGGC 
ATCATGCCGA AGACAGCCGC GACGATGGCA GAGGTGCTGA AGAACTACGG TTACAAGACA 
TCTGCCTTCG GCAAATGGCA TAACACGCCC GCCGACCAAA CCACCGCGAT GGGGCCGTTC 
AACTATTGGC CCACGGGCTA TGGCTTCGAA TACTTCTACG GCTTCCTGGC CGGAGAAACT 
TCGCAATGGG AGCCGCGCCT TGTCGAGAAC ACGACAGCCA TCGAGCCGCC GCACGATGAG 
AACTACCACC TGACTGAGGA CATGGCTGAC AAGGGAATCA CCTGGCTGAA GAAGCATCGC 
GCGTTTTCCC CGGATAAGCC GTTCCTCATG TACTGGGCTC CCGGCGGCGT CCACGGCCCG 
CACCACGTCA CCGCATCCTG GGCTGACAAA TACAAGGGAA AGTTCGATCA AGGTTGGGAC 
AAGCTGCGCG AGGAAGTCTT CGCCCGCCAG AAGACGCTTG GCTGGATACC CGCCAGCGCT 
GAACTCACAC CGCGAGACGC GACTATGCCC GCCTGGGGGG ACATCCCTGA AGCGGAACGG 
GCTTTCCAAA CGCGGCTGAT GGAACTCTAT GCTGGTTTCT GCGAACATAC AGATGCTCAG 
GTCGGCAAGC TGGTCGATTT CCTCGATGAA TCTGGTCAGC GCGACAACAC GATCATCCTC 
TACCTTTGGG GCGACAACGG CTCGTCGGCC GAAGGTCAGA ACGACTCTAT TAGCGAACTC 
CTCGCGCAGA ACCAGATCCC CAACACCATC GCACAGCAGA TCAAGGCGCT TGAGGGACTG 
GGCGGCCTGA AGGCGCTGGG CGGACCATTG ACCGACAACA TCTATCATGC GAGCTGGGCC 
TGGGCTGGGA GCACTCCCTT CCGTTCTACG AAACTCGTCG CGGCTCATTT TGGCGGCACA 
CGTAACCCGC TCGTCGTATC TTGGCCGAAG AGAATCAAGG CCGATAAGAC TCCACGCTCT 
CAGTTCTATC ATGTCAACGA CATCGTTCCG ACGCTCTATG ACGTGATCGG CATCAAGGCC 
CCGAACGAAG TGAACGGGTT CCCGCAGGAC CCCATCGACG GCGTCAGCAT GGCCGCCAGC 
TTTGCCGACC CGAAGGCACC AGAGAATAAA CACGTCCAGT ATTTCGACAA CAACGGCAGC 
GACGGCATTT ACAAGGATGG CTGGTATGCC TGCACATTTG GGCCGCTCAG CCCCTGGCTG 
AATGCCCAGC CCGGACTCGA TCAATGGGAT TCCTCGAAAG CCGTCTGGGA GCTGTATGAC 
CTCACCAAGG ACTTTTCGCA GATGCACGAC CTCGCGAAAG AGCATCCGGA GAAAGTCGAG 
GAAATGAAGA AGCTCTTTCT GGCACAGGCT GAGGAAAACA AAGCATTCCC CATCGGGGCT 
GGCATCTGGC TGCGAATCCA TCCCGAAGAC CGGATCAAAT CACCCTACAC GAGCTGGGTT 
TTCGATGACA CCACCACCCG CATGCCAGAG TTCACAGCGC CCGCGTTAGG CAACCACAAC 
AACATCGTCA CTATCGATCT TGATTGCGGC AAGGAAGCCA GCGGCGTGCT CTATGCGATG 
GGCGGCTCGG GCGGCGGCTT GACCTGCTAC ATGGACAAGG GCTATCTGAT CTTTGAATAC 
AATCTCATGA TCATAGACCG ATCCATTGCG AAGTCGGCGG AAAAGATCGC CCCCGGCAAG 
CACACCATTG TCGTGAACAC CGCACTCAGG GCCGCCAAAC CCGGTGCGCC AGCCGACATC 
GTGCTCACTG TGGACGGCAA GGAAGTCGGT CGCACCACGG CGAAGATGAC TGTGCCCGCC 
GCATTCACCG CCAGCGAAAG TTTCGATGTT GGCATTGATC TTGGCTCAAC GGTCTCCCGC 
GACTACTTTG AACGGCGTCC GTTTAAGTTC GATGGAAAGA TCAGCAAGGT AAACGTGGCA 
TTGGAGTGA

Protein sequence

MRQRTMTNTV VALICGMLGS GLGMCGTLTD VLGQNKARPA QVEGTVLPFP PAPTASKAGP 
TLQESIHKRR IEPNRLPKGA PNVLIVLIDD AGFGVPDTFG GFAHTPTLSR LRDEGISYNR 
FHTTSICSPT RAALLTGRNH QRVGNGTIAE RAVDWDGYTG IMPKTAATMA EVLKNYGYKT 
SAFGKWHNTP ADQTTAMGPF NYWPTGYGFE YFYGFLAGET SQWEPRLVEN TTAIEPPHDE 
NYHLTEDMAD KGITWLKKHR AFSPDKPFLM YWAPGGVHGP HHVTASWADK YKGKFDQGWD 
KLREEVFARQ KTLGWIPASA ELTPRDATMP AWGDIPEAER AFQTRLMELY AGFCEHTDAQ 
VGKLVDFLDE SGQRDNTIIL YLWGDNGSSA EGQNDSISEL LAQNQIPNTI AQQIKALEGL 
GGLKALGGPL TDNIYHASWA WAGSTPFRST KLVAAHFGGT RNPLVVSWPK RIKADKTPRS 
QFYHVNDIVP TLYDVIGIKA PNEVNGFPQD PIDGVSMAAS FADPKAPENK HVQYFDNNGS 
DGIYKDGWYA CTFGPLSPWL NAQPGLDQWD SSKAVWELYD LTKDFSQMHD LAKEHPEKVE 
EMKKLFLAQA EENKAFPIGA GIWLRIHPED RIKSPYTSWV FDDTTTRMPE FTAPALGNHN 
NIVTIDLDCG KEASGVLYAM GGSGGGLTCY MDKGYLIFEY NLMIIDRSIA KSAEKIAPGK 
HTIVVNTALR AAKPGAPADI VLTVDGKEVG RTTAKMTVPA AFTASESFDV GIDLGSTVSR 
DYFERRPFKF DGKISKVNVA LE