Gene Plim_1567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_1567
Symbol
ID	9138267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	2018988
End bp	2020559
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	54%
IMG OID
Product	sulfatase
Protein accession	YP_003629599
Protein GI	296121821
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0183451
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACAACA ATGTTTCTCT CTCAAGTTTC ACACGATGGA TTCATAACCA ATCGGCATGG 
GCCCTGCTGC TGGCAGTCAG TTTGATCCAT TCGACGATGG TGGTGGCTCA CGAGAATTCT 
CCTCAATCTC CACCCAAGCG CCCCAATGTC CTGATGATTG CCATTGATGA CCAGAATGAC 
TGGATCGAAC CTCTGGGTGG GCATCCACTG GTCAAAACGC CGCAACTTAA ATCACTTGCT 
GAGCGAGGTA CGGTCTTTTT GAATGCTCAT TGCCAGGCCC CTTTATGCAA TCCTTCGCGA 
ACGAGTCTTC TCTTAGGCTT GCGGAGCACG ACAACGGGCA TCTATGGATT GTCTCCCTGG 
TTTCGAGATG TCCCGGCGCT CTCGGGACGA CTGACGTTGC CGCAGGCCTT TGGCAAGGCA 
GGCTATACCA CTCTCAGTAC AGGAAAGATC TTTCATGGAG GTGGCGGTAA GCCCAAAGAT 
CGCCTGAAAG AGTTCGACGA ATGGGGCCCA GCGGGAGGTG TCGGAAAACG TCCTGAAAAG 
CGGCTTATCC AGCCTCCGCC TCACTCCAAT CCACTGGTCG ATTGGGGTGC CTTTCCTCAT 
CTCGACAGTG AGAAAGGCGA TACTCAGATC ACCGATTGGG CCATTGAAAA ACTCAAACAG 
CGGCAAGTCC AACAGTCGTC ATCAACAGGT GAATCCAAAC CTTTTCTGAT GTGTGTGGGG 
TACTTCCTGC CACATGTTCC CTGCTACGTC ACGCCCGAAT GGCTGGCCAT GTATCCTGAT 
GACGATTCGA TTTTGCCGTT CATCGAAAAA GATGATCGAA AGGATACCCC CCGCTTCTCC 
TGGTATCTGC ATTGGCGGCT TCCCGAACCA CGACTCAAAT GGCTGCAGCA GCATGAGCAC 
TGGAGATCTC TGGTGCGTTC CTACCTGGCG TCGACTTCGT ATGTCGATGC CCAGATCGGG 
CGACTGTTGG CCGCGCTGGA AGCGACAGGC GAGGCAAACA ATACGTTGAT CGTCCTCTGG 
TCGGACCATG GCTGGCATCT GGGTGAGAAA GGGATCACGG GTAAGAACAC GCTCTGGGAA 
CGCTCCACCC GTGTGCCTCT CCTCTTCGCC GGCCCGGGAG TTCTCGCAGG TGGAAAATGT 
GTAGAACCCG TCGAACTGCT CGATATCTAC CCCACTCTGG CACAGCTTTG CCAGCTTGAG 
GCCCCGACTG ATCTGGAAGG GGTCTCACTG GTTCCGCAAT TGACAAACCC ACTCGCTGTT 
CGCCAGCGAC CGGCAATCAC TTCCCACAAT CAAGGCAACC ATGCGATCCG TACGCGAGAT 
CATCGCTACA TTCGCTATGC CGATGGATCG GAAGAGTTGT ACGATCACCT CGTCGATCCT 
CATGAACTCA AGAATCTTGC CGATGATCCT GCACATTCAG GCCTCAAGAA ACAGCTCAAT 
TCATGGCTCC CATCGATCGA TCAACCACCT GTGACGGGAA GTAAAGACCG CGTTCTCACC 
TTTGACCGGC AGACGAACCG CGCGATCTGG GAAGGCGAGA TCATTGAGCG TTCGTCACCC 
ATCCCGGAGT AG

Protein sequence

MNNNVSLSSF TRWIHNQSAW ALLLAVSLIH STMVVAHENS PQSPPKRPNV LMIAIDDQND 
WIEPLGGHPL VKTPQLKSLA ERGTVFLNAH CQAPLCNPSR TSLLLGLRST TTGIYGLSPW 
FRDVPALSGR LTLPQAFGKA GYTTLSTGKI FHGGGGKPKD RLKEFDEWGP AGGVGKRPEK 
RLIQPPPHSN PLVDWGAFPH LDSEKGDTQI TDWAIEKLKQ RQVQQSSSTG ESKPFLMCVG 
YFLPHVPCYV TPEWLAMYPD DDSILPFIEK DDRKDTPRFS WYLHWRLPEP RLKWLQQHEH 
WRSLVRSYLA STSYVDAQIG RLLAALEATG EANNTLIVLW SDHGWHLGEK GITGKNTLWE 
RSTRVPLLFA GPGVLAGGKC VEPVELLDIY PTLAQLCQLE APTDLEGVSL VPQLTNPLAV 
RQRPAITSHN QGNHAIRTRD HRYIRYADGS EELYDHLVDP HELKNLADDP AHSGLKKQLN 
SWLPSIDQPP VTGSKDRVLT FDRQTNRAIW EGEIIERSSP IPE