Gene Smed_0797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0797
Symbol
ID	5321634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	856612
End bp	857970
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	61%
IMG OID	640789734
Product	putative signal peptide protein
Protein accession	YP_001326488
Protein GI	150396021
COG category	[S] Function unknown
COG ID	[COG4222] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.19288
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.532583
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAAT CCATCCTTGC CGCTATGGCG CTGATACTGC TGGCGTCGAG CGCCGCGCTT 
GCCGAGGAAA AGGTCTTTCC TGCAACGCTC AAGGCGCATG CGATCCTTCC CGCCAATACG 
ATCATCGCCG CGCCGGCCAA CGCTGCGGAC TACCTCAAGA CCTCGGGCAA GTTCGCGACC 
GCCGACCGCA AGCGCGCCGT GGAGCTCGGC AGCGTCGGGG GCAAGGATGG CGTTCGCCCA 
ACCGGTCTGT CGCTCCCCTT AAACGGGCAG CCGATGCAGG GCTTCTCTGG AATCAAGGCA 
ATGGAGGACG GCACGTTCTG GAGCCTGTCG GACAACGGCT TCGGGAACAA GCTCAACTCG 
ACCGACGCAA TGCTGATGTT GCACCATCTC AGGATCGACT GGGAAGCCGG CAAGGTGCAG 
GCGCTGAAGA CCCTGTTCAT GTCCGATCCG GACCACAAAG CCCCCTTCCC CATCGTCATG 
GAAGGATCGG CCACCCGCTA TCTGACCGGC GGCGACTTCG ACGTCGAATC CATCCAACCG 
GTCGCAGACG GTTTCTGGGT CGGAGAAGAA TTCGGCCCCT ATATTCTGAA GTTCGACACG 
GCCGGCAAGC TCACCGATGT CATCGCAACG ATGGTCGATG GCGAGCCCGT GGTTTCGCCC 
GACAATCCGG CGCTGACACT GCAGGGGGAT CCCTCCAAAA AGGCGCCCGC GTTCAATCTG 
AAGCGTTCCG GTGGTTACGA AGGGCTTGCA CTTTCGAAGG ACGGTACGAG ACTCTATGGT 
TTGCTGGAGG GCCCGATCTG GGCGGACAGC GAATCCGTAG AACAGGCGGA CGGCCGGCCT 
GCACTGCGGA TCATCGAACT CGATGCCGCA AGCAAGGCCT GGACCGGACG CAGCTGGCTT 
TATCCCCTCG CCGAGGGCGG TGAAGCGATC GGCGATTTCA ACATGCTCGA CGAGAAAACC 
GCGCTGGTCA TCGAGCGCGA CAACGGCGCC GGCACGGTCG ACAAGGCCTG CGCAGATCCG 
AAGAACCCGC AGCCGGATTG CTTCGCAGTC GGATCGAAGG TGAAGCGGAT CTACAAAATC 
GCAATGGATG ACGAGAATGT CGGCGGGGCC GTGCGCAAGA TCGGTTACAT CGATCTCCTG 
AAAATCGCCG ATCCGGACAA TCGCAAGCGC CAGGGTGGAG GCGAAGGCTT TTACGACATG 
CCCTTCGTCA CGATCGAGAA TGTCGACCGG GTGGACGCGA CGCATATCAT CGTCGGCAAC 
GACAACAACC TGCCATTCTC CGCCGGCCGT TCGCTCGACA GGGCGGATGA CAACGAGTTC 
GTGCTGCTCG AAGCCGGCGA TTTCCTGAAG GCGGAGTGA

Protein sequence

MTKSILAAMA LILLASSAAL AEEKVFPATL KAHAILPANT IIAAPANAAD YLKTSGKFAT 
ADRKRAVELG SVGGKDGVRP TGLSLPLNGQ PMQGFSGIKA MEDGTFWSLS DNGFGNKLNS 
TDAMLMLHHL RIDWEAGKVQ ALKTLFMSDP DHKAPFPIVM EGSATRYLTG GDFDVESIQP 
VADGFWVGEE FGPYILKFDT AGKLTDVIAT MVDGEPVVSP DNPALTLQGD PSKKAPAFNL 
KRSGGYEGLA LSKDGTRLYG LLEGPIWADS ESVEQADGRP ALRIIELDAA SKAWTGRSWL 
YPLAEGGEAI GDFNMLDEKT ALVIERDNGA GTVDKACADP KNPQPDCFAV GSKVKRIYKI 
AMDDENVGGA VRKIGYIDLL KIADPDNRKR QGGGEGFYDM PFVTIENVDR VDATHIIVGN 
DNNLPFSAGR SLDRADDNEF VLLEAGDFLK AE