Gene Smed_2141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2141
Symbol
ID	5323001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2209241
End bp	2210374
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	61%
IMG OID	640791079
Product	peptidase M24
Protein accession	YP_001327809
Protein GI	150397342
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.776272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAATT ATCCGGCGAT CACCAGTACG GAGCGCCAAA CGCGCATATC CCGTTTGCGG 
GCCACTCTTT CGGAGCGGAA CGTCGGCGGG CTCCTGCTGG GTTCTACGGA AAGTCTCCGC 
TACTATACAG GGCTGGAGTG GCACGCCAGC GAACGGTTCC TCGGCGCTCT CATCACGGGT 
TCCGACCTGA TCTATATCGC CCCCGCGTTC GAGCTGAGCC GGGTCGAGAC CCTGTCACGC 
GAACCAGGTG AAATCCGCGC ATGGCAGGAG GAGGAAAGCA GTGCCGCCCT CGTCGCATCG 
CTTCTGCCTC CTGAGGCGAC ACTCGCTGTC GATGATTCAC TGCCGTTGTT TGCGTATAAC 
GCTCTGGTGG GGGAAATTGC GGCCCGCAGG CTGATTGACG GAGGTCCGCT TATCCGTGCC 
CAACGAAGGT TGAAATCTGC GGCCGAGATC GAGATCATCC AGTTCGCGAT GAACCTGACC 
CTGGAGGTGC ATCGGCGCGC GCATAAGTTC ATCAAACCTG GGATTTCAGC GTCGGAGGTC 
AGGCGCTACA TCGACGATCA GCATCGGCTG CTCGGCGCTC CAGGCGGCTC CAGTTTCTGT 
ATCGTCTCCT TCGGAGATGC GACTGCGCTG CCCCATGGGG CGGAGGGGGA ACAGGTCTAC 
AAGCCCGGCG ACGTGGTGCT GGTCGACACC GGCTGCCGCA TTGGCGGCTA CCACTCGGAC 
CTGACCCGGA CCTATATGAT CGATGACCCG ACGCCCGAAT TCGCTCGTAT TTGGGCTATC 
GAGAGGGAAG CTCAGCTGGC CGTGTTCGAA GCTGCTCACA TCGGAGCCAC ATGCGGCAGC 
CTTGATTCGG CTGCCCGAGA CGTTCTCGTT CGCAACGGGC TCGGGCCGGA CTACAAACTC 
CCGGGTCTTC CTCACCGCGC CGGGCACGGG ATCGGCCTCG AAATTCACGA GGAGCCATAT 
ATTGTCCGCA GTAATCACTT CGCCCTCTCC GAAGGTATGT GCTTCTCGGT CGAGCCTATG 
ATCGTCGTTC CGGAAGCGTT CGGCGTTCGC CTCGAGGACC ACATCTACAT GAGCAAAGAC 
GGCCCCGTCT GGTTTACGGC GCCCGCCGAA GGCCCCACCG AGCCGTTCGC TTGA

Protein sequence

MANYPAITST ERQTRISRLR ATLSERNVGG LLLGSTESLR YYTGLEWHAS ERFLGALITG 
SDLIYIAPAF ELSRVETLSR EPGEIRAWQE EESSAALVAS LLPPEATLAV DDSLPLFAYN 
ALVGEIAARR LIDGGPLIRA QRRLKSAAEI EIIQFAMNLT LEVHRRAHKF IKPGISASEV 
RRYIDDQHRL LGAPGGSSFC IVSFGDATAL PHGAEGEQVY KPGDVVLVDT GCRIGGYHSD 
LTRTYMIDDP TPEFARIWAI EREAQLAVFE AAHIGATCGS LDSAARDVLV RNGLGPDYKL 
PGLPHRAGHG IGLEIHEEPY IVRSNHFALS EGMCFSVEPM IVVPEAFGVR LEDHIYMSKD 
GPVWFTAPAE GPTEPFA