Gene Smed_1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1451
Symbol
ID	5322305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1530377
End bp	1531678
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	64%
IMG OID	640790395
Product	peptidase M15A
Protein accession	YP_001327131
Protein GI	150396664
COG category	[S] Function unknown
COG ID	[COG3108] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.556547
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00120403
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGCAACATC TGGAAACAGG ACGCGGTCTC CTGACAATCG GACGCGCCGC GGCATTATCC 
GTATCGCTGC TGGCACTCGC CGGATGCGTT TCCGCCGTTG CGGATGGCGA GACGATCGAC 
CCCCTCAAAT CGCAGCAGAC GGCGGAAGCA TCATTGGCAG GCTCCCAGGA AATATCGCCG 
GGTAAGCAAG AGGCGGTGCC TGACGACAGG ACCGCGCAGG CGCCCGACGG CGCGACGGCG 
GATGCCGGAC AGAGCGCAGC CGTGCAGCCC GGCCTTACCA TGCAGGGAAC TGCGCTACGC 
GCCACATCAT CGAGTATTTA TGGAGAATCG CCGGCGGCGA CATCCGCAGC CGTGCAGCCG 
GACCCAAGCA ACCAGCCGAC GCCAGCCGCC GCAGCACCGA GAATGAATGC CAGGACCAAC 
AGCCTGTTCA GCAACGGGCA ATCCGAGGCC CAAACGGCGA ATCAGCCGCC GCAGGGGGCC 
TCGGCAGGGC AAACTCCTGC GGCAAACGAA ACGATTGCGG CTACAGGTCC GACTGCCGCA 
GTCGATATGC CCGTGTCGGT ACCGTTGCCT TTGAGCGCGC AGGCAGCACT GTCAGGAGCG 
ACCGCGTCGG CCCTGCAACC GGTCGAAGTC GCTTCCGCAG CGGCGGTGAG CACGCCTTCC 
GCGGGCCCCG GCGAAGGCGA GAAGGAGACA AAAGGGGCGA AGAAGACCTG GACCCTGGCG 
AGCCTGTTCG CGCCCAAACG CAAGGAAATG CCGCGCGAAA CACACGCTGC GCAAGCAAGC 
CGGAAGAAGA CGATAACCGT GAGTAATGCG GGTCAGCCTC AGATCGCATC TCTCGCCTAT 
GCTTCCCTGC CGGGCGTCAA TATGAATCCG CTCTTCAGCG TGGAGCACGA TGCGCATGCT 
GCCGACGAGG ACGACGCGCC CTTGGAAGTG GCCAACCTCT CCGGCCTCGC CCGACTCACA 
CCGAACGGCC TCATACTGCA AACCGAGAAG GTGGAAACAG GCTGCTTCAA ACCGGAGCTT 
CTCAACATTT TGAGAACGGT GGAAGCGCAT TACGGCCGCA AGGTCATGGT CACCTCGGGC 
CTGCGCGCCA TCAAGGTCAA CCGCAAGCGC CAGTCCCGAC ACACACGATG CGAGGCGGCC 
GACATTCAGG TGGCGGGCGT CAGCAAATGG GAGCTTGCAG ATTTCCTGCG CAAAGTTCCG 
GGCCGCGGCG GCGTCGGCAC CTATTGTCAC ACCGAATCCG TACACATCGA CATCGGCCCG 
CAACGGGACT GGAACTGGCG GTGCCGCCGC CGCAAGGGTT GA

Protein sequence

MQHLETGRGL LTIGRAAALS VSLLALAGCV SAVADGETID PLKSQQTAEA SLAGSQEISP 
GKQEAVPDDR TAQAPDGATA DAGQSAAVQP GLTMQGTALR ATSSSIYGES PAATSAAVQP 
DPSNQPTPAA AAPRMNARTN SLFSNGQSEA QTANQPPQGA SAGQTPAANE TIAATGPTAA 
VDMPVSVPLP LSAQAALSGA TASALQPVEV ASAAAVSTPS AGPGEGEKET KGAKKTWTLA 
SLFAPKRKEM PRETHAAQAS RKKTITVSNA GQPQIASLAY ASLPGVNMNP LFSVEHDAHA 
ADEDDAPLEV ANLSGLARLT PNGLILQTEK VETGCFKPEL LNILRTVEAH YGRKVMVTSG 
LRAIKVNRKR QSRHTRCEAA DIQVAGVSKW ELADFLRKVP GRGGVGTYCH TESVHIDIGP 
QRDWNWRCRR RKG