Gene Pmen_2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pmen_2101
Symbol
ID	5109835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas mendocina ymp
Kingdom	Bacteria
Replicon accession	NC_009439
Strand	-
Start bp	2329908
End bp	2331752
Gene Length	1845 bp
Protein Length	614 aa
Translation table	11
GC content	66%
IMG OID	640503345
Product	sulfatase
Protein accession	YP_001187594
Protein GI	146307129
COG category	[R] General function prediction only
COG ID	[COG3083] Predicted hydrolase of alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.102341
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0551221
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCAGCC ATCCATCGAC GCGCCGCGCC GACTCGCTGT ATTGGTTCTT CACCTGGCTC 
GCCGTCGCCG GGCATCTGTC CCGCGCCTTC GACCCGCCGG CGAGCCTCGC TCTGGGGCTG 
TACCAGCTGG TGTTGCTCGG TAGCTACGCG CTGCTGTTCA TCGCTCCTCT GTGGTTGCTG 
TGCCAGCTTG GCAGCCGGCT GCGCCGCAGT CTCGGCCTGA CGCTGTCGGT GCTGCTGGCA 
GGCCTGCTGC AGTTGCTGAT CTACGCCGAC GGACTGCTTT GGCAGCTGTA TGGCTTTCAC 
CTCAACGGTT TCGTCTGGAA CATCCTCACC ACGCCGGGCG GTATCGCGGC CCTGGGCTCT 
TCCGAATCGA CCCAGAGCGG CTTCGCCCTG ATCGCCGCCG CGCTGTTGCT GGGCCAGGCG 
CTGCTGCGCC TGCTGGCCAG TGCGCTGGCC AGATGGCAAC CGCGGCTACC CGCGCCGCGC 
TGGCTGTGGG TGCTGCCGCT GTTTCTCCTG GCCACGCTGG GCGAGCGCGT CAGCTACGGC 
GTCAGCCACT TCTACGGCTA CAGCCCCCTG CTCGAGACCG CTCAGCGCAT GCCCTTCTAT 
CAGCCGCTGA CCATGCGCCG CTTCCTCGAG CAACAGCTCG GCCTGCAGCG ACCGCAGCGT 
CTGGAGCTGG AAAACGTCGC ACTCAAGGGC CAGCTCAAGT ATCCGCAGGC GCCGCTGCGT 
CTGACGCGGC CGGACAAACC GCTGAACCTG GTGTGGCTGG TGGCCGAATC CTGGCGTGCC 
GACAGCCTCA ACCCACGGGT GATGCCGCAG ACCGACGCCT TCGCGGCGCG CGCGCAACGC 
TTCGACAGTC ATTTCTCCGG TGGCAACGGC ACCCGTATCG GCATGTTCAG CCAGTTCTAC 
GGCCTACCGG CCAACCTCTG GTTTCCGGTA CTGGATGCGC GTATCGGCAG CCCGCTGATC 
GACGTGTTGC AACAGCAGGA CTACCAGATG CGCCTGTTCA CCAGCGCCAA GTTCAGCTAT 
CCGGAGTTCG ACAAGACCCT GTTCGTCAAG GTGCCACCGG CGCAGATGCA ATCCTATGAC 
CGCGGGCCGA GCTGGCAGCG CGACCGCAAG AACGTCGACG ACCTGCTGCA GTTCATCGAC 
CAGCGCGACC GTGCGAAGCC TTTCATGACC TTCATGTTCT TCGAGTCGCC GCACGCCAAC 
TACGACTTCC CGCCCGAGTC GGTGATCGAG CCGGACTACC TACCGGACTT CAGCTACGCC 
AGCATGGACC TGGAGCGCGA CATCGACGGC ATCTACAAGC GCTACCTGAA CGCCGTGCAC 
CACCTTGACG GGCAGATCGC CCGGGTCGTC GACCATCTCG AACAGCGCGG GCTGCTGGAC 
GACACGCTGA TCGTGATCAC CGGCGATCAT GGCGAAGAGT TCATGGATAA TGGCCGCTGG 
GGCCACAACT CCACCTTCGT CGATGCCCAG CTGCGCGTGC CGCTGGTGCT CTGGGTGCCG 
GGCCGCGAGG CGCAGCGCAC CGAGCTGCGC ACCAGCCATG TCGACCTGCT GCCAACCCTG 
CTGCCGCTGC TGGGAGTGAA CAACCCGGCG CATGACTACA GCATCGGCCA GAGCCTGTTC 
AGCCCCAGTT CGCCGCGGCT GCTGGTGGCT GGCGACTGGG ACCGCCTGGC CTTCCTCGGC 
GAACGGCACA AGGTGGTGCT GCCATTCACC AGCGGCAGTT TCACCGCCCT GCAGGCCAGC 
CGAGCCGATG ATCGGCACCT GGCGAACGCC GCCAGCGTGC TGCAACAGGC TCTGCCACAG 
ATCCGCAGCG AGCTGCAGGG CTTCAGACGC TTCCTCGCGC ACTGA

Protein sequence

MSSHPSTRRA DSLYWFFTWL AVAGHLSRAF DPPASLALGL YQLVLLGSYA LLFIAPLWLL 
CQLGSRLRRS LGLTLSVLLA GLLQLLIYAD GLLWQLYGFH LNGFVWNILT TPGGIAALGS 
SESTQSGFAL IAAALLLGQA LLRLLASALA RWQPRLPAPR WLWVLPLFLL ATLGERVSYG 
VSHFYGYSPL LETAQRMPFY QPLTMRRFLE QQLGLQRPQR LELENVALKG QLKYPQAPLR 
LTRPDKPLNL VWLVAESWRA DSLNPRVMPQ TDAFAARAQR FDSHFSGGNG TRIGMFSQFY 
GLPANLWFPV LDARIGSPLI DVLQQQDYQM RLFTSAKFSY PEFDKTLFVK VPPAQMQSYD 
RGPSWQRDRK NVDDLLQFID QRDRAKPFMT FMFFESPHAN YDFPPESVIE PDYLPDFSYA 
SMDLERDIDG IYKRYLNAVH HLDGQIARVV DHLEQRGLLD DTLIVITGDH GEEFMDNGRW 
GHNSTFVDAQ LRVPLVLWVP GREAQRTELR TSHVDLLPTL LPLLGVNNPA HDYSIGQSLF 
SPSSPRLLVA GDWDRLAFLG ERHKVVLPFT SGSFTALQAS RADDRHLANA ASVLQQALPQ 
IRSELQGFRR FLAH