Gene Plim_0789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_0789
Symbol
ID	9137472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	1024044
End bp	1025621
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	56%
IMG OID
Product	sulfatase
Protein accession	YP_003628833
Protein GI	296121055
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0797845
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTCTCA AAGGAAGCCG GTGGCTTTCC ATGCTCGCTG TTGCGCTTGT TCTCGTGGCT 
CACACGGGAG TAGCGCTGGC CCAAACCAGG AAGCCCAACA TTCTGGTCAT CTGGGGCGAC 
GATATCGGCA CCTGGAATAT CAGCCACAAC AGCCGCGGCA TGATGGGCTA CCAGACGCCG 
AATATCGATC GACTGGGCAA AGAAGGACTG GCCTTCACCG ATTATTACGG TCAGCAAAGT 
TGTACGGCGG GCCGCGCTGC TTTTCTGGGA GGCAACGTCC CTGTCCGCAC TGGCATGACC 
AAGGTGGGTC TGCCCGGAGC GAAAGAAGGC TGGCAGAAGA CCGACGTGAC CATCGCGACC 
GTCCTGAAGT CACAAGGCTA CGCGACAGGT CAGTTTGGTA AGAATCACCA GGGCGATCGC 
GACGAGCATC TTCCCACAAT GCATGGCTTC GACGAGTTCT TCGGAAACCT CTACCACCTG 
AACGCTCAGG AGGAACCGGA GAATGAGGAT TATCCCACCA ACATGAGGAT GGCCAATGGC 
AAGACTTTCA TCGAGAACTA CGGGCCACGC GGCATTATTC GCAGCAAAGC CGATGGCAAG 
GGTGGTCAGA CAATCGAGGA CACTGGCCCA TTGACCAAAA AGCGCATGGA GACCATCGAC 
GAAGAAACCG TGGCGGCCGC TAAGGACTTT ATCACCCGCC AGAAAAATGC CGACCAGCCC 
TTCTTCTGCT GGTGGAACGG CACACGAATG CACTTCCGCA CACATGTCAA GAAAGAGAAC 
CGTCATCCGG GAAATGACGA ATACACCGAT GGCATGATCG AGCACGATGG TCACGTGGGC 
GAATTGCTCA AACTGCTCGA TGAACTGGGG CTCGCCAAAG ACACGATCGT CATGTATTCC 
ACGGATAACG GCCCGCACTA CAACACCTGG CCGGATGCGG GCACGACGCC TTTCCGCAGC 
GAGAAAAACT CGAACTGGGA AGGTGCTTAC CGTGTCCCCT GTTTCGTGCG CTGGCCAGGC 
CGGTTTCCGG CAGGCAAAAC ACTGAATGGC ATCGTCTCTC ACGAAGACTG GCTCCCCACA 
CTGGCTGCCG CCGCTGGTGC CAGCGATATC AAGCAAAAGC TCGCACAAGG GGTCGAACTC 
AACGGCCGCA AATACCGCAA CTATGTGGAT GGCTACAATC AGCTCGATTA CTTCGGCGGC 
AAGACGGATC AATCGCCCCG GAACGAATTT ATCTATGTGA ATGACGACGG CCAGATTGTC 
GCCCTGCGAT ACGATGCATG GAAGGCTGTG TTTCTTGAGA ACCGGGGGGA GGCATTTGGC 
GTGTGGCGAG AACCCTTTAC CGAGCTGCGT GTGCCGCTGT TGTTCAATCT GCGCCGCGAT 
CCCTTCGAGC GCTCACAGCA CAATTCGAAC ACCTATAACG ACTGGTTCCT CGACCGCGTT 
TTTGTGATCA CGCCGATGCA GCAGATGGCG GGCAAGTTTC TGATGACGAT GAAGGAGTAT 
CCACCCAGCC AGACACCCGG CTCATTCAAC CTGGAAAAAA TCCAGAAGAT GATCGAGGCC 
GGTGCCAGCG GGAAGTAA

Protein sequence

MFLKGSRWLS MLAVALVLVA HTGVALAQTR KPNILVIWGD DIGTWNISHN SRGMMGYQTP 
NIDRLGKEGL AFTDYYGQQS CTAGRAAFLG GNVPVRTGMT KVGLPGAKEG WQKTDVTIAT 
VLKSQGYATG QFGKNHQGDR DEHLPTMHGF DEFFGNLYHL NAQEEPENED YPTNMRMANG 
KTFIENYGPR GIIRSKADGK GGQTIEDTGP LTKKRMETID EETVAAAKDF ITRQKNADQP 
FFCWWNGTRM HFRTHVKKEN RHPGNDEYTD GMIEHDGHVG ELLKLLDELG LAKDTIVMYS 
TDNGPHYNTW PDAGTTPFRS EKNSNWEGAY RVPCFVRWPG RFPAGKTLNG IVSHEDWLPT 
LAAAAGASDI KQKLAQGVEL NGRKYRNYVD GYNQLDYFGG KTDQSPRNEF IYVNDDGQIV 
ALRYDAWKAV FLENRGEAFG VWREPFTELR VPLLFNLRRD PFERSQHNSN TYNDWFLDRV 
FVITPMQQMA GKFLMTMKEY PPSQTPGSFN LEKIQKMIEA GASGK