Gene Smed_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1643
Symbol
ID	5322501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1737035
End bp	1738156
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	57%
IMG OID	640790583
Product	outer membrane protease
Protein accession	YP_001327315
Protein GI	150396848
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4571] Outer membrane protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.13084
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCTGCG AATACTTCCA TTCCCTAAAG GCGTTGAAGC TGCCAGCCTC GCAACGGCAG 
GACGACACCG GTCCCTCAAC ACCAGCGGCT TGCCAAGTGG GCAAGTCTGA CACGAAGGGG 
ATCCGAGGCG AAGAAGCTCA GGCTCAAGAC GGAGGCGCTG TACGAAAGAC GCGGTCAGCT 
ATGAAGCGCG TCTCCATCAG ATCCGTAGCG ATCTCCTGTT TTCTGTACGG TGCCCCATCA 
TTCGCCGCCG CAGACAACGC TCTGTTTTCC TCCGACGATG GCAACGTCGT CGTTTTCGGC 
GATATCGGCC TCGCCAACAT AAAGGCGCAG GAATTTTTCT ATGTCGGCGA CCACAAGATC 
AGCCAGTTGA ACTGGGAGAG TAAAGGAGTC ACTCTTTTCA CGGTTGGCGT CGACGGGCAG 
ATCGACAACG ACTGGAGCTT GAAGGGCAGC GTCAAAGTCG GCACCGGCGG CAATGGTCAC 
CTGGTTGACT ACGACTGGAC GATCATCGAG CGCGAAGACT GGAGCGACCG CTCAATCCAC 
CCGCTTACCG AACTCGATCA CTATGTCGCC GCAGCGATCG AGTTGGACCG GATCATCTAC 
GGCAACGACA CCAGCAGTAT CGCGGTCGGC GCTGGTATGC GCTATACCGA CGTCAAATGG 
ACCGCCTATG GCGGGTCAGG CATCTCTACG AAGAAAACGT TCCGCGATAA ACGTTGGGAA 
TTGCTAGACT GGGAAAGAGG CGCAAGCTAC CGGCAAAAAA TTCCGGTGGG CTTCCTCAGC 
CTGAGCGGCG AACACGTCCT CGGCGATCTT ACCATCAGCG GCGGCCTTCA GACCGGTCTG 
AGCTTCGGCA TCAAGAGCAT CGACGACCAT TGGCTGCGCA ACCTGCGTTT TTCGGATGAC 
ATGTCTCCGG CACCGACAAT CGGCGCCAAT GTCGCCGTCA GCTATGCGGT GACGCCCGGT 
GCTTCGCTTT ATCTGTCCGG TTCGTTCGAG CGGGTGTTTC ACAGCCGCGG GGACAAGGAA 
CGTCACAACT TCGCGACAGG CGAAATTGAA TTCCGCAAGG ATTATGCCGG GGCCACGTTC 
GAGGCAATGT CAGTCTCCTT CGGGCTAAAG GGCACGTTTT GA

Protein sequence

MVCEYFHSLK ALKLPASQRQ DDTGPSTPAA CQVGKSDTKG IRGEEAQAQD GGAVRKTRSA 
MKRVSIRSVA ISCFLYGAPS FAAADNALFS SDDGNVVVFG DIGLANIKAQ EFFYVGDHKI 
SQLNWESKGV TLFTVGVDGQ IDNDWSLKGS VKVGTGGNGH LVDYDWTIIE REDWSDRSIH 
PLTELDHYVA AAIELDRIIY GNDTSSIAVG AGMRYTDVKW TAYGGSGIST KKTFRDKRWE 
LLDWERGASY RQKIPVGFLS LSGEHVLGDL TISGGLQTGL SFGIKSIDDH WLRNLRFSDD 
MSPAPTIGAN VAVSYAVTPG ASLYLSGSFE RVFHSRGDKE RHNFATGEIE FRKDYAGATF 
EAMSVSFGLK GTF