Gene Smed_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0020
Symbol
ID	5320847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	17332
End bp	18291
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	63%
IMG OID	640788951
Product	signal peptide peptidase SppA, 36K type
Protein accession	YP_001325715
Protein GI	150395248
COG category	[O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0616] Periplasmic serine proteases (ClpP class)
TIGRFAM ID	[TIGR00706] signal peptide peptidase SppA, 36K type

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.000184229
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGAAC TCGCCATAGC CGACCGCCGC AGCCTGCGCA GAAAGCTGAG CTTCTGGCGT 
TGGGCGGCGG CGGCCGTTCT CTTCGCCGGC GGCCTTGCCC TGTTTGCCTT TTCCGGCTGG 
GGCGATGTGA CGGAGCGCGC CCGCGATCAC GTTGCGCGCG TCGCCGTCAC AGGTTTGATC 
CAGGACGACC GGGAACTGGT CGAGCGGCTG GAACGGATTG CCGAGAACCA GTCAGTCAAG 
GCATTGATCG TGACGATCTC GTCCCCGGGG GGCACGACCT ATGGGGGTGA GGTCATATAC 
AAGGCGGTCC GCAAGGTGGC CGCCAAAAAA CCGGTGGTCT CGGACGTGCG CACGCTTGCC 
GCGTCGGCAG GCTACCTGAT CGCGCTCGCG GGCGACCGTA TCGTCGCCGG CGAGACGTCG 
ATTACCGGTT CGATCGGCGT CATCTTCCAA TATCCCCAGG TCAAGACCCT GATGGACAAG 
CTCGGCGTGT CGCTCGAATC GATAAAGTCG AGGCCCCTCA AGGCCGAGCC CTCGCCGTTC 
CATCCTCCGA GCGACGAGGC GAGGGCCATG ATTCAGGCGA TGATCGACGA CAGCTACGGA 
TGGTTCGTCG ACCTGGTGGC GGAGCGGCGC AAACTGCCGC GGGCGGAAGC GCTCGGCCTT 
GCGGATGGTC GGATCTTCAC CGGCCGGCAG GCACTGGAAG GCAAGCTCGT CGACGAACTC 
GGCGGCGATG ATGAAATCAG GGCTTTCCTG GCCGAAAGGA AGGTCTCGAA GGACCTGCCC 
GTCCTCGATT GGGAAGCTCC GAGCAGCACG CTGTCTTTCG GCCTCGGCTC GCTCCTGGCC 
GAAGCCGTCA AGGCGTTGGG ATATGAGGCT TTTCCGGCAA TGAAGGGCCT CGAAAAGACC 
GGCCTGGACA AGTTGTTTCT TGACGGTCTT CTTTCGGTTT GGCAGGTTGA AGGGCAATGA

Protein sequence

MDELAIADRR SLRRKLSFWR WAAAAVLFAG GLALFAFSGW GDVTERARDH VARVAVTGLI 
QDDRELVERL ERIAENQSVK ALIVTISSPG GTTYGGEVIY KAVRKVAAKK PVVSDVRTLA 
ASAGYLIALA GDRIVAGETS ITGSIGVIFQ YPQVKTLMDK LGVSLESIKS RPLKAEPSPF 
HPPSDEARAM IQAMIDDSYG WFVDLVAERR KLPRAEALGL ADGRIFTGRQ ALEGKLVDEL 
GGDDEIRAFL AERKVSKDLP VLDWEAPSST LSFGLGSLLA EAVKALGYEA FPAMKGLEKT 
GLDKLFLDGL LSVWQVEGQ