Gene Plim_3419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3419
Symbol
ID	9140135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	4426682
End bp	4428262
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	54%
IMG OID
Product	sulfatase
Protein accession	YP_003631431
Protein GI	296123653
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACCG TCCGATTTGC CTTAATTCTC AGTCTGGGCT GGCTGGCTCT CTTCTCTCCT 
GATGTTCAGA TCTCACCTGC TATGGCGGCA GAAAAGGCGG CACCGCCCAA CATTCTGTTC 
ATCTTCAGCG ATGACCTTGC CTATCAGGCC ATCAGTGCCT ATGGAGACGA GCGAAAGCTC 
CTCGAAACAC CTCATATCGA CCGTGTGGCG AAAGAGGGGA TCCGCTTTGA TCGCTGTGTC 
GTCACGAACT CGATCTGCGG GCCTTGCCGT GCCACCATTC TGACAGGCAA GTACTCGCAT 
AAAAACGGGT TCTACAACAA CACCAACTCA CGCTTTGACA GCACCCAAAC GACATTCCCT 
AAGCTGCTCA AATCGCAGGG GTACAGCACG GCACTCATTG GCAAATGGCA CCTCATCAGC 
GAACCCACAG GCTTTGATCA TTGGGAGATC CTGCCAGGGC AGGGCATCTA TTACAACCCG 
CCCATGATCG CCAATGGCCA GAAGGTGCAG CGAGAAGGCT ACGTCACCGA CATCATTACG 
GATCGATCGA TCGACTGGCT GAAAAATCGC GACAAATCCA AGCCCTTTCT GCTGATGGCA 
CAGCATAAGG CTCCGCATCG CGAATGGTCG CCTGCACTCA GGCATCTGGG GTTCAACAAA 
GACAAACCGT TTGCCGAACC CGCGACGCTC TTTGATCAGC ACAAAGATCG CGCTCAGGCA 
GTCGTTGATC ACGATATGGG GATCGACCGC ACCTTCACCA AGCTCGATGC CAAACTCGTC 
CCGCCTCCCG GCATCAACAG CACTCAACTC GAAGAATGGA ACAAGTACTA CCTGCCGCGT 
AATAACGCCT TTGAAGCAGC CCATCTTCAA GGTCAGGATC TCGTGCGCTG GCGCTATCAA 
CGGTACATGC ACGATTATCT GGCCTGTGTG AAGGCCGTCG ATGAAAGTGT GGGCCGATTA 
CTCCAGACGC TCGATGAAGA AGGCCTTGCC GAAAACACAC TCGTGGTGGT TTCATCCGAT 
CAGGGCTTTT ATCTGGGTGA ACATGGCTGG TTCGATAAAC GCTGGATCTT TGAAGAATCT 
CTGCGGACAC CTCTGCTCGC GCGCTGGCCA GCCGCTATTC CTGCAGGCCG CACGAATGGA 
CAGATTGTCT CGCTGCTCGA TATTGCCCAG ACATTCCTCG ATGTCGCAAA AATCGACGCA 
CCAAACGACA TGCAGGGGGC CAGCCTCCTG CCACTGCTGA AAGGGGATAC GCCCGCTGAC 
TGGCGAAAAT CGCTCTACTA TCGCTACTAC GAATACCCTT CACCTCACCG CGTCAAGCCG 
CATTATGGCG TGGTGACTGA TCGTTACAAA CTCGTGCATT ATGAAGGGAC TGGTGAAGGC 
GAATGGGAAC TGCTTGATCG ACAGGTTGAC CCCCAGGAAG TCAAAAGCTT CCATAACGAC 
CCGGCCTATG CCCAGACCAT GACAGAACTC AAAGACGAAA TTCGACGTCT CCAGAAAGTG 
GTTGACGATC AGACGCCACC TCCCGCTAAG GCTTATGGGA ATGCTCCGCT CGAATGGTCC 
CCCTTCGGCC CATTGAAGTA A

Protein sequence

MNTVRFALIL SLGWLALFSP DVQISPAMAA EKAAPPNILF IFSDDLAYQA ISAYGDERKL 
LETPHIDRVA KEGIRFDRCV VTNSICGPCR ATILTGKYSH KNGFYNNTNS RFDSTQTTFP 
KLLKSQGYST ALIGKWHLIS EPTGFDHWEI LPGQGIYYNP PMIANGQKVQ REGYVTDIIT 
DRSIDWLKNR DKSKPFLLMA QHKAPHREWS PALRHLGFNK DKPFAEPATL FDQHKDRAQA 
VVDHDMGIDR TFTKLDAKLV PPPGINSTQL EEWNKYYLPR NNAFEAAHLQ GQDLVRWRYQ 
RYMHDYLACV KAVDESVGRL LQTLDEEGLA ENTLVVVSSD QGFYLGEHGW FDKRWIFEES 
LRTPLLARWP AAIPAGRTNG QIVSLLDIAQ TFLDVAKIDA PNDMQGASLL PLLKGDTPAD 
WRKSLYYRYY EYPSPHRVKP HYGVVTDRYK LVHYEGTGEG EWELLDRQVD PQEVKSFHND 
PAYAQTMTEL KDEIRRLQKV VDDQTPPPAK AYGNAPLEWS PFGPLK