Gene Smed_5108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5108
Symbol
ID	5319410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	54795
End bp	56099
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	60%
IMG OID	640776886
Product	peptidase M24
Protein accession	YP_001313818
Protein GI	150377223
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.239431
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0245052
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATTG TTGTTTTCGA CCCTGATAGC GTGGATGACG TCGATTTCAA GGACCGCATG 
CGTCATCCGG CGGCGGCTGA TCCGGCCGGA GGCATGTGGC TGTCGGACAC CGAGCCGTCC 
TTCATCGACG CCGACGCTCT GCGCACGGGG CGGCTGAAGA AGCTTCGGGA CTGGATGCGC 
ACGGCCGGTT ACGGTGCGGT CGTCCTTTTC GACCCCTATA ACCAGCGCTA TGCAACAGGT 
TCCCGGAACA TGTTCGGGTA CTTCCTGCGC AATTCCACCC GCTACTTTTT CATCCCCACG 
GAAGGTCCGA TCGTCCTTTT CGAGTATCCG CAGAGCTATC ACGTCTCTAT GGTTCTCGAC 
ACGATCGATG AGGCTCGTCC TTCCAAGCTC GTCTGGTCCT CCGTTTCCGG CAAGGACGAC 
GAGACCGCAG GGCCCTTCGC CGACGAGATC ACCGATCTGC TCAGGCAGCA CGGCGGCGGG 
TCGATGAAGA TCGGGATGGA CCGCTGCAGC CATTTGCAGG CACTGGCGCT CGAGAAGCGC 
GGATGCGAGG TGAGGGACTG TCAGGGCGAA ATTCTCGCGG TGCGCGCGGT GAAGACTCCC 
GAAGAGATCA AATGCCTTCA GGTTTCAATG GCCGGTGCCG AAGCGGCAGT CGCCGCCGTG 
CGCGAAGCGA TCAAGCCGGG GGTATCCGAA AACGATCTCT TCGCGATCAT GTACCATGAA 
GTGATCCGGC AGGGGGGCGA GTTCATCGAG ACCCGTCTGC TGAGTTCCGG CCAGCGAACC 
AATCCCTGGT TCAACGAGGC GAGCGGCCGT AAGATCAGGC CGGGGGAACT CGTGGCCCTC 
GATACGGATA CGATCGGCTG CTACGGCTAC TATTCCGACT TCTCGCGAAC CTTTCGCTGC 
GGCCCCGGCA AACCGACGCT TTACCAGAAA TCGCTCTATC GGATGGCATA CGAGCAGGTT 
CAGCATAATA TCGACATCGT CAAGCCGGGC ATGGCCTTCC GGGAGATCGC TGAAAAGGCG 
TGGAAGATTC CCGACCGCTT CGTCGATCAG CGGTACACGT CCGTGATGCA CGGCGTCGGC 
ATGCACGGAG AGACGCCGTT CATCGCCCAT GCGATCGACT ACGAGACCTA TGGGCGCGAT 
GGATATCTCG TGCCCGGCAT GGTCGTTTCC GTCGAAAGCT ACATCGGCGA AAAGGACGGG 
CGCGAGGGCG TGAAACTCGA AGACGAGATC CTCATCACGG AGAGCGGGAC GGAGCTCCTG 
TCGCGTTTCC CCTATGAGGA AGAATTCCTG AGCGGGGAGA CTTGA

Protein sequence

MSIVVFDPDS VDDVDFKDRM RHPAAADPAG GMWLSDTEPS FIDADALRTG RLKKLRDWMR 
TAGYGAVVLF DPYNQRYATG SRNMFGYFLR NSTRYFFIPT EGPIVLFEYP QSYHVSMVLD 
TIDEARPSKL VWSSVSGKDD ETAGPFADEI TDLLRQHGGG SMKIGMDRCS HLQALALEKR 
GCEVRDCQGE ILAVRAVKTP EEIKCLQVSM AGAEAAVAAV REAIKPGVSE NDLFAIMYHE 
VIRQGGEFIE TRLLSSGQRT NPWFNEASGR KIRPGELVAL DTDTIGCYGY YSDFSRTFRC 
GPGKPTLYQK SLYRMAYEQV QHNIDIVKPG MAFREIAEKA WKIPDRFVDQ RYTSVMHGVG 
MHGETPFIAH AIDYETYGRD GYLVPGMVVS VESYIGEKDG REGVKLEDEI LITESGTELL 
SRFPYEEEFL SGET