Gene Swit_2354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Swit_2354
Symbol
ID	5199938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingomonas wittichii RW1
Kingdom	Bacteria
Replicon accession	NC_009511
Strand	-
Start bp	2616981
End bp	2618537
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	70%
IMG OID	640581900
Product	protease Do
Protein accession	YP_001262851
Protein GI	148555269
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTTATG CCTATGGGAT CACCGCGGCC TTGCTGGCGG GCGGTGCGGC CGCAACCCTG 
ACCTTGCAGC AACCGGTCGG CGCCCAGGTG GCGCAGAACG CGCCGGGCTC GATCAACGCG 
ACCGCACCCC GACCGGGCGC GCCGATGAGC TTCGCCGATC TCGCGGCCAA GCTGCAGCCG 
GCGGTCGTCA ACATCTCCAC CACCCAGAAG ATCCAGGTGC GCGGCGGCGG CAACGCCTTC 
TCCGGCACCC CGTTCGAGGA ACTGTTCCGG CGCTTCGGCG GCGGCCAGGG CGACGACGGC 
AAGCCGATCA CGCGCGAGGC GACCTCGCTC GGCTCGGGCT TCATCATCTC GCCCGACGGC 
TATGTCGTCA CCAACAACCA CGTCATCTCG GCCTCGCCCG AGGGCGGCAG CGGCGCGGTG 
GTCAGCTCGA TCACCGTCAC CCTGCCCGAC CGCAAGGAAT ATAAGGCGAC GATCGTCGGC 
CGCGACCAGA CGTCGGACCT GGCGCTGCTC AAGATCGACG CGAAGAACCT GCCCTTCGTC 
CAGTTCGGCG ATTCGACCCG TACCCGGGTC GGCGACTGGG TGGTGGCGAT CGGCAATCCG 
TTCGGCCTCG GTGGCACGGT GACGGCGGGC ATCGTCTCGG CGCTGCACCG CTCGATCGGC 
ATCAACGGCC CCTATGACCG CTACATCCAG ACCGACGCCT CGATCAACCA GGGCAATTCG 
GGCGGCCCGA TGTTCGATCT GCAGGGCAAC GTCATCGGCA TCAACACGGC GATCTTCTCG 
CCGACCGGCG GCAATGTCGG CATCGGCTTC GCGATCCCGG CCGAGGAGGC CAAGCCGATC 
ATCGACCAGC TCCGCACCGG CCAGCGGGTG CGGCGCGGCT ATCTGGGCGT CGGCATCCAG 
CCGATGACCG AGGACATCGC CAGCAGCCTG GGCCTGCCCA AGGACCGCGG CGAGATCGTC 
GCCCGGGTCG AGCCGGGCGA GGCGGCGGCG CGCGCGGGCA TCCGCCAGGG CGACGTCATC 
GTCCGCGTCG ACAATCAGGA GATCACCCCC GACAACACGC TGTCCTACAT CGTCGGCAAG 
GCCGCGGTGG GCGCGCGCCT GCCGATCGAG CTGATCCGCG AGGGCCAGCG CAAGACGGTG 
ACGGTGACGC TGGGCGAACG CCCGCCCGAG GACCAGCTCG CCAGCGCCGG CAACCTCGAC 
GAGGACCAGG GCGACGACGC CCCGGGCGCG GCGCAGAGCG CGCCCGACCA GTCGACCCGC 
ACGGCGATCG GCCTCGGCCT GCAGACGCTG ACGCCCGACA TCGCCCGGCG CCTGGGCGTC 
TCGTCGACGC TGCGCGGCGT GGTGATCAAC TATGTCGATC CGTCGAGCGA TGCCGCGGCC 
AACGGCTTCC AGCCGCGCGA CATCATCCTG CAGATCAACA ATGTGCCGGT GGCGACGGTC 
CAGGCGGCGG CGGCGAAGAT CACCGAGGCG CAGAAGGCCA AGCGCCCGAC TGTGCTCTTG 
TTCGTCCAGC GCGGCAACAA TCCGCCGCGC TATGTGGGCG TGCAGATCCG CAACTGA

Protein sequence

MRYAYGITAA LLAGGAAATL TLQQPVGAQV AQNAPGSINA TAPRPGAPMS FADLAAKLQP 
AVVNISTTQK IQVRGGGNAF SGTPFEELFR RFGGGQGDDG KPITREATSL GSGFIISPDG 
YVVTNNHVIS ASPEGGSGAV VSSITVTLPD RKEYKATIVG RDQTSDLALL KIDAKNLPFV 
QFGDSTRTRV GDWVVAIGNP FGLGGTVTAG IVSALHRSIG INGPYDRYIQ TDASINQGNS 
GGPMFDLQGN VIGINTAIFS PTGGNVGIGF AIPAEEAKPI IDQLRTGQRV RRGYLGVGIQ 
PMTEDIASSL GLPKDRGEIV ARVEPGEAAA RAGIRQGDVI VRVDNQEITP DNTLSYIVGK 
AAVGARLPIE LIREGQRKTV TVTLGERPPE DQLASAGNLD EDQGDDAPGA AQSAPDQSTR 
TAIGLGLQTL TPDIARRLGV SSTLRGVVIN YVDPSSDAAA NGFQPRDIIL QINNVPVATV 
QAAAAKITEA QKAKRPTVLL FVQRGNNPPR YVGVQIRN