Gene Smed_3984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3984
Symbol
ID	5317910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	434822
End bp	436018
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	64%
IMG OID	640775792
Product	hypothetical protein
Protein accession	YP_001312725
Protein GI	150376129
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4692] Predicted neuraminidase (sialidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCCTG AGGAAATCGC AAACGCAATG ACCGGCAAGC TCCGGGAAGC CAGGGACGGC 
AGACTGGAAT CGCTGCTCCC GTCGCCCACG GTGCAGAACC ATGCGGCCTT TCTGCACAGG 
CTCGAGGACG GAAGTCTCGT CTGTGCCTGG TTCGGCGGTA CGCTAGAGGG AAAATCCGAT 
ATCTCGATCT TCGCTTCCGT GCTCGCGCCA GGCGCCGAGC GATGGGGCGA ACCGCAGCGG 
CTGAGCTTCG ACGCAGACCA TTCCGAACAG AACCCGGTAC TCTTCACGGC GCCCGACGGT 
CGGTTGTGGC TTTTCCATAC CTCCCAACCT GCGGGCAATC AGGACGAGTG CCGCATCCGC 
ATGGCCGCGA TCGAGAGGGA TCCTGACGAT CCGACGAAAC TCGATGCCGC CGAGGGGCGC 
TATCTCGACC TGCCGCGCGG CTGTTTCATC CGCGCGCCGC TGGTCGTGAG AGATGATGGC 
GCCTGGCTGC TTCCCATCTT TCGCTGCATT CAACGCCCCG GCCAGAAGTG GAACGGCAGC 
CACGACAACG CGGCGGTCGG CATTTCGACC GACGGCGGTG AAAGGTGGCG GCTCGCCGAT 
CTGGAGGACT CGATCGGTTG CGTGCATATG AGCCCGGTCC CAGTCGGCGG AGACGGCTAC 
GCCGCCTTCT TCCGTCGCCG CCAGGCGGAC CAGGTGTACC GCGTCGAAAG CGCCGATGGC 
GGACGGACAT GGAGCTTGCC GGCGCCGACC GATGTGCCGA ACAACAATTC CTCCATCGCC 
GTCATTCGCT TGAGCGACGG CCGATTGGCC ATGATCTGCA ATCCCGTGAA CGCGGCCCTT 
TCGCCCGATC GCCGGGCGTC GCTTTACGAC GAACTCGGAG AGGATGACGG CCGGCCCGAC 
GCTGATCCGT CGGGCGGGTG CGTGCCTATT TGGGGCGTGC CGCGAGCACC CGTAAGCGTC 
TGCCTGTCGG ACGACGGCGG CCGTACCTTC CCCGAGCGCA TCGTGATCGA GAATGGACCG 
GGGACATGCC TCTCCAACAA TTCGACCGAT GGCCACAACA AGGAAATGTC CTATCCGTGG 
CTCCTGGAGG GAGACGACGG CAGCCTGCAC ATCGCCTACA CCTTCCATCG GCGTGCAATC 
AAATATGTCC GTCTGCCGCC CGGATGGGCA GACCGGACTG ACGGGAGAAT TCGATGA

Protein sequence

MTPEEIANAM TGKLREARDG RLESLLPSPT VQNHAAFLHR LEDGSLVCAW FGGTLEGKSD 
ISIFASVLAP GAERWGEPQR LSFDADHSEQ NPVLFTAPDG RLWLFHTSQP AGNQDECRIR 
MAAIERDPDD PTKLDAAEGR YLDLPRGCFI RAPLVVRDDG AWLLPIFRCI QRPGQKWNGS 
HDNAAVGIST DGGERWRLAD LEDSIGCVHM SPVPVGGDGY AAFFRRRQAD QVYRVESADG 
GRTWSLPAPT DVPNNNSSIA VIRLSDGRLA MICNPVNAAL SPDRRASLYD ELGEDDGRPD 
ADPSGGCVPI WGVPRAPVSV CLSDDGGRTF PERIVIENGP GTCLSNNSTD GHNKEMSYPW 
LLEGDDGSLH IAYTFHRRAI KYVRLPPGWA DRTDGRIR