Gene Plim_3999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3999
Symbol
ID	9140719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5133062
End bp	5134465
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	51%
IMG OID
Product	sulfatase
Protein accession	YP_003632009
Protein GI	296124231
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAGAT CTTCCATTAT GAGACTGTGG TTGGTGCTGA TTCTGGCGTT TCAATTCACC 
AGTCAACTGG CTTTGGCTCA GAGGGCCACA ACAGAAACAA CCAGCGAACG TCGCCCCAAC 
ATTTTATTGA TACTCTCTGA TGACTGCGGA CATGCCGAGT TTTCGATTCA AGGTCATCCC 
CGTTACAAGA CCCCGCACAT TGATTCGATT GGCAAGAACG GTGTCCATTT TCGACAGGGA 
TATGTCTCGG GATGTGTCTG CAGTCCATCG CGAGCGGGGT TATTGGCAGG ACGGTATCAA 
CAGCGATTTG GGCATGAGTT CAATATCCCA CCAGCATATA GCGAGACAAA CGGCCTCCCA 
CGATCAGAAA CTTTGCTCCC TCAACTTCTC AAGGAAGATG GCTATCGAAC GATTGCACTC 
GGGAAATGGC ACCTGGGCTA TGCCCCACAG TTTCATCCCA TGGAACGGGG CTTTACTGAT 
TACTACGGAT TTCTGCAGGG CTCGCGAAGC TATTTCCCTC TCAAGAAACC AACTCGTTTG 
AATCAGATGC TGCGCGATCG GACTGCGATC CCTGAGGAAC AATTCGGCTA CATGACAGAT 
CATCTGGCCG ATGAGGCCAT TGCCTATATC AAACAGTGGC AGTCTCAACC GTGGATGATG 
TACCTGGCAT TCAATGCGAC TCATAGCCCC AACGATGCCA CGGCAGTCGA TTTGCAGGCG 
GCTGATGGCA ACAAGATTTA TGCGATGACC ATCGCTCTCG ATCGCGCTGT CGGAAAAGTT 
CTGGATGCCC TGAAGGAGTG CGGCCTGTCG AAAGATACTC TGGTGATCTT TATCAACGAT 
AATGGCGGAG CAGGCGGGCA CGACAATGGT TCGCTACACG GGAAAAAAGG CTCAACCTGG 
GAAGGAGGCA CAAGAATTCC TTTTCTCGTT CAATACCCTG CGAAGATTCC TTCCGGTCAA 
GTGATCGATG AGCCTGTGAT TGCTCTCGAT CTCTTTCCCA CCATCCTCGA TGTGGCTGGT 
CTTGGTGATG CTGAACTGAA GAAGATCCCG TTCGATCCTG AGAAGCTGGA TGGCATCAGC 
CTGATTCCCA GAATGACGGG CAAAACCCAA CGACTGGTCG ATCGACCACT GTATTGGAAG 
TCTGGAAAAC GATGGGCGAT TCGACAGGGA AACTTGAAAG CCGTCTCGGG CAACGATGAC 
CAGGGTGATC AAGTTGAGTT ATTTGATCTC TCAAGTGATC CTGACGAGCA GCGAAACCTG 
GCTGCGACAC ACCCCGACGA ACTTCAACAG CTCGAAGCAC TCTACCGCAA GTGGGAATCC 
ACTCTCGAGA AACCCCGCTG GGGGTCATCG CCTGGTAAAA AAAGTGGCAG CGGTACCGAC 
GAGAGTTCTT CCGATAATCC TTGA

Protein sequence

MRRSSIMRLW LVLILAFQFT SQLALAQRAT TETTSERRPN ILLILSDDCG HAEFSIQGHP 
RYKTPHIDSI GKNGVHFRQG YVSGCVCSPS RAGLLAGRYQ QRFGHEFNIP PAYSETNGLP 
RSETLLPQLL KEDGYRTIAL GKWHLGYAPQ FHPMERGFTD YYGFLQGSRS YFPLKKPTRL 
NQMLRDRTAI PEEQFGYMTD HLADEAIAYI KQWQSQPWMM YLAFNATHSP NDATAVDLQA 
ADGNKIYAMT IALDRAVGKV LDALKECGLS KDTLVIFIND NGGAGGHDNG SLHGKKGSTW 
EGGTRIPFLV QYPAKIPSGQ VIDEPVIALD LFPTILDVAG LGDAELKKIP FDPEKLDGIS 
LIPRMTGKTQ RLVDRPLYWK SGKRWAIRQG NLKAVSGNDD QGDQVELFDL SSDPDEQRNL 
AATHPDELQQ LEALYRKWES TLEKPRWGSS PGKKSGSGTD ESSSDNP