Gene Plim_2379 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_2379
Symbol
ID	9139090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	3101571
End bp	3102983
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	53%
IMG OID
Product	sulfatase
Protein accession	YP_003630404
Protein GI	296122626
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGATATC CGATTTACTT TGCGCTGTTG TTGTTTATGG GCGCGCCGTT CTTCCCGGTT 
GAAGCGAAGG AAATGGCGGA CAAACCCAAT GTCCTGCTGA TCTTCATCGA CGATCTCGGC 
AAAACCGACA TTGGCATTGA GGGCTCCTCG TTTTACGAAA CACCACGCAT CGATGCTCTC 
GCAAAATCCG GGGCACGCTT TACACAGTTT TACTCGGCAC ATCCTGTCTG CTCGCCAACT 
CGGGCCGCTT TGATGACTGG AAAAATGCCT CAGCGTTTGG GCATTACCGA CTGGATTCGC 
CCCGAGAGCG ACGTCGCTCT GCCGCAATCC GAAGTCACCA TCGGGCAGGC TTTTCAGGAA 
GCTGGCTATC ACACCGCGTA CCTTGGCAAA TGGCACCTCG GGCACAAACC ACAACAGCAT 
CCTGCAGCCC GAGGCTTCGA TTGGACGAAA GGCGTCAATC ACGGTGGCCA GCCCTCCAGC 
TATTATTTCC CGTACAAAAA TCCCCAGAAA CCCGATGCGC CGAATAACGT CCCCGATTTT 
GAAAAATGCC AGCCAGAGGA CTACCTGACC GATGTCTTGA CCTCCAGTGC CATTGAGCAT 
CTGCAGCAGC GCGATCGCAC ACGTCCGTTC TTTCTGTGTT TAGCTCATTA CGCAGTCCAT 
ACACCCATTC AGCCACCTAA AAATCTGGTC GAAAAGTATC AGGTCAAATT GGCCACACAG 
AAGAATCCAA AATCTCCAGG CGAGGGGATT CAAGAAGGTT CGGCCATCTC TCGCAGCCAG 
CAGGATCATC CCGCATACGC AGCCATGGTC GAGAATCTCG ATACGCAGGT GGGCCGTCTG 
CTCGATGAGC TCAAAACTCA AGGAATTCTG GATCAGACGA TTGTCGTCTT CACTTCAGAT 
AATGGCGGTC TGTGTACGTT AAATGGTAAA TCGCCAGGGC CGACCTGCAA TCTTCCTTTA 
CGAGCCGGCA AAGGCTGGAC TTATGAAGGG GGCATTCGCA TCCCCACGTA CATTTCCTGG 
CCCGGGAAGA TCTCGCCTCA GGTGCTCGAT ATCCCAGCTT ACACTTGTGA TATTTATCCG 
ACACTTTTAA GCCTGTGCCA GATACCACCC AGGCCCACTC AGCATGTCGA TGGAATCTCA 
CTCGCCGGTT TGCTCACGAA GTCGTCAAGT TTGCCAGAGA GCGAACGAAC TCTCGTCTGG 
TATTACCCTC ATACGCACGG CTCAGGCCAC AAACCCTCAG CCGCCATTCG ACAAGGCCCC 
TGGAAGCTGA TTCATTTTCT CGAAACAGAC CGTATTGAAC TCTACCATCT CGAAGACGAT 
CCTGGCGAAA GTCGCAACCT CGCATCGAAG CATCCCGAAC GAGCCCTCCA ACTTCAGAAG 
GAGTTGCAGA AAATCATCGA GTCTTCCAGT TAA

Protein sequence

MRYPIYFALL LFMGAPFFPV EAKEMADKPN VLLIFIDDLG KTDIGIEGSS FYETPRIDAL 
AKSGARFTQF YSAHPVCSPT RAALMTGKMP QRLGITDWIR PESDVALPQS EVTIGQAFQE 
AGYHTAYLGK WHLGHKPQQH PAARGFDWTK GVNHGGQPSS YYFPYKNPQK PDAPNNVPDF 
EKCQPEDYLT DVLTSSAIEH LQQRDRTRPF FLCLAHYAVH TPIQPPKNLV EKYQVKLATQ 
KNPKSPGEGI QEGSAISRSQ QDHPAYAAMV ENLDTQVGRL LDELKTQGIL DQTIVVFTSD 
NGGLCTLNGK SPGPTCNLPL RAGKGWTYEG GIRIPTYISW PGKISPQVLD IPAYTCDIYP 
TLLSLCQIPP RPTQHVDGIS LAGLLTKSSS LPESERTLVW YYPHTHGSGH KPSAAIRQGP 
WKLIHFLETD RIELYHLEDD PGESRNLASK HPERALQLQK ELQKIIESSS