Gene Smed_2143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2143
Symbol
ID	5323003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2211507
End bp	2213453
Gene Length	1947 bp
Protein Length	648 aa
Translation table	11
GC content	59%
IMG OID	640791081
Product	hypothetical protein
Protein accession	YP_001327811
Protein GI	150397344
COG category	[S] Function unknown
COG ID	[COG3533] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.56985
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTTGC CCCAAAACAA GGCCGCCGAA GTCAAGCCAC GCGCCTTCGA GCGTTTTGTG 
CCTGTCGACC ACACTCGCGT AGCCTTTGAT GGCGGGTTCT GGCAGAGTTG GTCGGAAACC 
GTCCGAAGCG TCACTATACC CACTCAGCAC AGGCGCCTCG AAGAGGAGGG CTTCCTCGAA 
GTCCTGGATT TCGAAAAGCC GCCGTCACCA CTCGTCCGCC CTATCCAGCC CAGCGGACTG 
TCGATGCAAC ATTTCTTCGA CTCTGACTTC GGCAAATGGA TTGAGGCTGC GAGCTATACG 
CTCAAGAACC ATCCTGATCC GGACATTGAA GCCAAGATCG ATGCGATCGT GGAAAGGCTG 
GAGCACGGAC AGATGCCAGA TGGCTATCTG AACAGCTGGT TCATCCGGCG CGAACCGGAC 
AAGCGCTGGA CCAACCTGCG CGACCTGCAT GAAATGTATT CGATGGGCCA TCTGATCGAG 
GGAGCCGTGG CCTATTTCGA GGCTACCGGA AAACGGCGGT TCCTGGACGT GATGATCCGT 
GCCGTCGATC ACATCATCGA CACTTTCGGG ACGGAGCCGG GCAAACTGCG CGGCTACGAT 
GCCCATGAGG AAGTCGAACT GGCGCTTGTG AAGCTTTATC GCTTAACCGG CGACCCCAGG 
CACCTGAAAC TCGCTACCTA TTTCGTCGAC GAGCGCGGCC GAATGCCGTC CTACTTCGAC 
GAGGAAACGC GCCGGCGGGG GGAGAATCCG GCCGATTATG TCTACGGGAC CTATGCCTAC 
AGTCAGGCGC ACATGCCCGT CCGCAATCAG ACGCAAGTCG TTGGCCATGC CGTGCGAGCT 
ATGTATCTCT TCTCAGCGAT GGCGGACCTA GCCTATGAAA ATGACGATCC TAGCCTAAAG 
CACGCCTGCG ACCGCCTGTT CGACAATCTG ATAGGCCGTC AGCTTTACAT AACCGGAGGT 
CTCGGGCCAT CCGCATCCAA CGAAGGCTTC ACGCGCGAAT ATGATCTGCC GAACACGACG 
GCCTATGCGG AGACATGTGC CGCGGTCGCG CTTGGTCTGT GGAGCCATCG CATGGCGCAG 
CTTGACCTGG ACAGCAAGTT CACCGACGCC CTGGAAACAA TTCTATTCAA CGGCGCGCTT 
TCTGGAATTT CGCGAGACGG TGAGCACTAT TTCTACGAGA ACGTGCTCGA AAGCCACGGC 
CAGCATCGCC GCTGGAAATG GCATTACTGC CCATGCTGCC CGACGAACAT CGCCCGCTTC 
ATAACGTCGC TGGGCCAGTA CTTCTATTCT GCAAAGCGGG ACGAAATCGC TGTCCACCTC 
TACGGTGCCA ACACAGCCGA GCTGGAAATC CAGGGCCAAT TCGTGCGACT TCGGCAAGAA 
ACCAGCTATC CGTGGGATAA GGATGTTCTT CTCGCCCTTG GTCTGGTTGC GCCGACCCGG 
CTCACCTTCA GGCTGCGAAT CCCTGGCTGG TGCCGTAACG CCCGGTTGTG GGTAAACGGA 
GAGCAAATGG ACCTCGGCGC ATCGCTTGAA AAGGGCTATG CGGTCGTGAA CCGCGAATGG 
GTCGACGGGG ATGAAATCCG TCTGACTTTC GAGATGCCAG TGGAGCGCCT CTACGCCCAT 
CCAGCAGTAG GGGAGGACGC GCAGCGTGTC GCTCTTAAGC GCGGTCCGGT CGTCTATTGC 
GTCGAGGAGA CGGACATTGG CACGGAACCC CAGCGCCTGA GAATCTCAGC GGACACCAAC 
CTCACCCCGC GCTTCGACGA AACCCTGCTT GGCGGTGCCG TCGTGCTTGA GGGAGAAGCA 
TTGGAAGCCG ATGCCGAGGA TTGGGGGCCA ACGCTCTATT GCAACAGGCC ACCTTCCTTG 
AAGGGAAGAA CGTTCAAGGC GATACCCTAT CACCTCTGGG CCAATCGTGA CGAGGGCGCA 
ATGCAGGTCT GGCTGACGGA GAAGTAG

Protein sequence

MSLPQNKAAE VKPRAFERFV PVDHTRVAFD GGFWQSWSET VRSVTIPTQH RRLEEEGFLE 
VLDFEKPPSP LVRPIQPSGL SMQHFFDSDF GKWIEAASYT LKNHPDPDIE AKIDAIVERL 
EHGQMPDGYL NSWFIRREPD KRWTNLRDLH EMYSMGHLIE GAVAYFEATG KRRFLDVMIR 
AVDHIIDTFG TEPGKLRGYD AHEEVELALV KLYRLTGDPR HLKLATYFVD ERGRMPSYFD 
EETRRRGENP ADYVYGTYAY SQAHMPVRNQ TQVVGHAVRA MYLFSAMADL AYENDDPSLK 
HACDRLFDNL IGRQLYITGG LGPSASNEGF TREYDLPNTT AYAETCAAVA LGLWSHRMAQ 
LDLDSKFTDA LETILFNGAL SGISRDGEHY FYENVLESHG QHRRWKWHYC PCCPTNIARF 
ITSLGQYFYS AKRDEIAVHL YGANTAELEI QGQFVRLRQE TSYPWDKDVL LALGLVAPTR 
LTFRLRIPGW CRNARLWVNG EQMDLGASLE KGYAVVNREW VDGDEIRLTF EMPVERLYAH 
PAVGEDAQRV ALKRGPVVYC VEETDIGTEP QRLRISADTN LTPRFDETLL GGAVVLEGEA 
LEADAEDWGP TLYCNRPPSL KGRTFKAIPY HLWANRDEGA MQVWLTEK