Gene Plim_0354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_0354
Symbol
ID	9137013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	439671
End bp	441152
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	54%
IMG OID
Product	sulfatase
Protein accession	YP_003628404
Protein GI	296120626
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCTCT ATCTAGCGAT GACGCTATTG ATTCTGCTGA TTGGAAGTCC ATGGGTGCAG 
GCGGCACCTC CGAATATCGT CATTCTGTAC GCGGATGATA TGGGCTATGG CGATCTTCAC 
ATTCAGAATC CAGAGTCCCG GATCCCCACA CCACATCTTG ACCGACTCGC CCGACAAGGG 
ACTCGCTTTA CCGATGCCCA CAGTTCGTCT GGCATCTGTA CGCCCAGTCG ATATGCACTA 
TTGCAGGGGC GATATCACTG GCGCAAGTTT CACGGCATCG TGAACTCGTT CGACCCTCCC 
GTGCTTGACG ATGAAAAGCT GACGATTGCC GAACTTTTGA AAACCAAGGG ATACCGAACG 
GCCTGTATCG GTAAATGGCA CCTGGGCTGG GATTGGAATG CCATTAAGAA ACAAGGTGTA 
AAACCGACTG ACAAAGCCGG TTTTGCCGCT GATGCTTTTG ACTGGAGCCA ACCCATTCCG 
GGTGGGCCAC GATCACACGG GTTTGACTAC TACTTTGGCG ATGACGTCCC GAACTTTCCG 
CCCTATGCCT GGTTTGAGAA TGATCGTGTC ATCACGACAC CGACCGTCAC TTTAAAAACG 
ACAGCACCCA CTGCAGAAGG AAGCTGGGAG GCTCGGCCGG GCCCGGCTGT TCAAGACTGG 
GATTTCTGGG CTGTCATGCC CACACTCACG CAAAAAGCCG AGCAGTGGAT CAGCGAGCAG 
AAAGCCGATC AACCGTTCTT TCTCTACTTC CCTTTCACTT CGCCGCATGC CCCGATTGTG 
CCGACATCGG ATTTCACAGG TAAATCACAG GCTGGTGGCT ATGGCGACTT TATGTTCCAG 
ACAGACGACA CGGTCGGCCG CGTGCTGGCG GCTCTTGAGA AGCATGGGTT TTCGGAAAAT 
ACACTCGTGA TTTTCACGGC TGATAATGGC CCTGAGCGCT ACGCTTACGA TCGGATTCGA 
AACTTTGGTC ATCGCAGCAT GGGCCCACTG CGCGGGCTGA AACGCGACAT CTGGGAAGGT 
GGACATCGTG TGCCGATGAT TGTCCGCTGG CCGGGTGTAG TCCCCGCTGA AAAGGTGTGT 
GATGAACTCA TCAGTCAGAT CGATCTCTTC GCAACCATTG CGGCTGTTGT TGATGCAGAA 
ATCGCTCCAG GCTCCGCAGA AGACAGCTAC AATCAACTGG AATTGCTCAA AGGGACTGGT 
TCCAGTGCTC GCCAGACTCT GGTTCACAAC ACGAATCCCA AAGGCTATGC CCTCCGGCAT 
GGTGACTGGG TACTGATCGA CGCCAAAACT GGTGCGGTCA GTCAGGTTCC CAAGTGGTTC 
GATGAAGCCA ATGGTTACAC CAGCCACTCA TTGCCGGGTG AACTCTATAA CTTGAAGGAC 
GACCTCGCTC AGCGTCAGAA TCTGTATGCT GAGAATCCTG AAAAAGTTGC TGAGTTGAAA 
GCTCTACTCG GAAAAATTCA GGCCCAGGGC CAGGTTCGCT GA

Protein sequence

MPLYLAMTLL ILLIGSPWVQ AAPPNIVILY ADDMGYGDLH IQNPESRIPT PHLDRLARQG 
TRFTDAHSSS GICTPSRYAL LQGRYHWRKF HGIVNSFDPP VLDDEKLTIA ELLKTKGYRT 
ACIGKWHLGW DWNAIKKQGV KPTDKAGFAA DAFDWSQPIP GGPRSHGFDY YFGDDVPNFP 
PYAWFENDRV ITTPTVTLKT TAPTAEGSWE ARPGPAVQDW DFWAVMPTLT QKAEQWISEQ 
KADQPFFLYF PFTSPHAPIV PTSDFTGKSQ AGGYGDFMFQ TDDTVGRVLA ALEKHGFSEN 
TLVIFTADNG PERYAYDRIR NFGHRSMGPL RGLKRDIWEG GHRVPMIVRW PGVVPAEKVC 
DELISQIDLF ATIAAVVDAE IAPGSAEDSY NQLELLKGTG SSARQTLVHN TNPKGYALRH 
GDWVLIDAKT GAVSQVPKWF DEANGYTSHS LPGELYNLKD DLAQRQNLYA ENPEKVAELK 
ALLGKIQAQG QVR