Gene Smed_5853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5853
Symbol
ID	5320155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	815252
End bp	816439
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	60%
IMG OID	640777548
Product	peptidase M24
Protein accession	YP_001314480
Protein GI	150377885
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.183484
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACATCA ACGCAAGGGA CGCGCGGGCA GGGGAGCCGC CCTTCGATGC CGCGAAACTC 
GACAGACTGA TGGAACAGGC GGGTATCGAC GTTCTGCTCG CCACCTCCAA GCACAATACG 
CAGTACCTGC TGGGCGGCTA TAAATTCATC TTCTTCGCCG CAATGGATGC GATCGGCCAC 
AGCCGCTATC TGCCGATTGT CGTTTATGAG AAGGGCTCAC CCGATCATGC CGCTTATGTT 
GGCAATCGCA TGGAGGGAGG AGAACATAAG AACAATCCGT TCTGGACGCC CGCCGTTCAT 
ACAGCGACTT GGGGTACGCT CGACGCTGCA GAGCTTGCCG TAGAGCATCT GACGAAGATA 
GGTAAGGCGA GTGCTCGCAT CGGTATTGAG CCGGCCTTTC TGCCGGCGGA TGCGCGTGAC 
TTTCTGGCTT CTCGTCTCGA AGGTGCGCGG TTCATGGATG CGACGCACGC GCTGGAGCGA 
CTGCGGGCGA TCAAGAGGCC TGAGGAACTG CAGATGCTCA AGCTGGCGTC CGAACTGATC 
ACGGACTCAA TGCTCGCCAC CATCGCGGCA GCGCGGGAGG GTTCCACCAA GATCGAGATC 
ATTGAACGGC TCAGGCGGGA GGAGACCAAT CGAGGGCTGC ATTTCGAGTA TTGCCTGCTG 
ACCTTAGGTG CCAGTCACAA CCGTGCGGCC TCGCCGCAGG CGTGGGAGAA GGGCGAGGTG 
CTTTCGATAG ATTCCGGGGG GAACCATTGC GGCTACATCG GGGACCTTTG CCGTATGGGA 
GTGCTCGGAG ACCCCGATGC GGAGCTCGAA GATCTGCTGG CTGAAGTCGA GTCGATCCAG 
CAGACGGCCT TCGCCAAGAT CAAGGCCGGG GCCGCGGCCA GTGAGATGAT TGCGGCCGCG 
GAAGAGGTTT TGCAAAGCTC GCCATCGGCC GCCTTTACCG ATTTTTTCTG CCACGGCATG 
GGGCTCATTA GCCACGAAGC TCCGTTTTTG ATGACCAACC ACCCGGTCGC CTATGAAGGC 
AACGACGCGG ATCAGCCCCT GGAGGCAGGC ATGGTCATTT CTGTGGAGAC GACGATGCTT 
CACCCGAAGC GCGGTTTCAT CAAGCTCGAG GATACGCTCG CCGTCACGAA CGGCGGATAC 
GAGATGTTCG GCAACAGTGG GCGCGGCTGG AATCTCGGGG CGGCATAG

Protein sequence

MNINARDARA GEPPFDAAKL DRLMEQAGID VLLATSKHNT QYLLGGYKFI FFAAMDAIGH 
SRYLPIVVYE KGSPDHAAYV GNRMEGGEHK NNPFWTPAVH TATWGTLDAA ELAVEHLTKI 
GKASARIGIE PAFLPADARD FLASRLEGAR FMDATHALER LRAIKRPEEL QMLKLASELI 
TDSMLATIAA AREGSTKIEI IERLRREETN RGLHFEYCLL TLGASHNRAA SPQAWEKGEV 
LSIDSGGNHC GYIGDLCRMG VLGDPDAELE DLLAEVESIQ QTAFAKIKAG AAASEMIAAA 
EEVLQSSPSA AFTDFFCHGM GLISHEAPFL MTNHPVAYEG NDADQPLEAG MVISVETTML 
HPKRGFIKLE DTLAVTNGGY EMFGNSGRGW NLGAA