Gene Smed_1121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1121
Symbol
ID	5321967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1190101
End bp	1191288
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	61%
IMG OID	640790062
Product	hypothetical protein
Protein accession	YP_001326807
Protein GI	150396340
COG category	[S] Function unknown
COG ID	[COG3146] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.702528
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAGG CGATCAACAT CCGCATAGAA CATTCGTTCA CCTCGATATC GCCGGCAAGC 
TGGAGCAGGC TTGCCGGCGC CTCGAAGGGG CAAGCCGGCG CGCCCTATAA TCCCTTCGTT 
TCGCATGCCT ACCTTTCGGC GCTGGAGGAA TCGGGATCGG CAACAGCCGA AACGGGCTGG 
CTCGGTCAGC ATCTGCTGAT CGAGGAAGCG GACGGTTCCC TGCGCGGAGG CCTTGCCTGC 
TACATCAAGA GCCACAGCCA GGGCGAGTAT GTTTTCGACC ATGGATGGGC GGATGCCTTC 
GAGCGGGCCG GCGGCCGCTA TTATCCGAAA CTCCAATGTT CCATTCCCTT CACGCCGGCG 
ACGGGCCCGC GGCTGCTTGC GGCCGAGGGG TGCGATCAGC AGATGGTTCG CACAGCGCTG 
GCGGCCGGGC TCAAGGAACT TACACGCCGG CACCATCTAT CCTCAGCCCA TGTGACCTTC 
GTCCCCGGGG ACGAAATTGC CACCCTGGAG CAAGCGGGGT TTCTGCATCG GGTGGACCAG 
CAGTTCCATT TCTTCAATGA GGGCTATGGA TCGCACGGCG ACTTTATCGG CACGCTCGCC 
TCGCGAAAGC GCAAGGCATT GAAAAAAGAG CGCCGAGCGG CCGTCGAAAA CGGCATAACC 
ATCGACTGGC TGACCGGCAG GGATCTGACG GAAGAGATCT GGGACCAGTT CTTTGCCTTC 
TACATGGACA CCGGCGGACG CAAATGGGGC AGACCCTATC TGACGCGCGC GTTCTACTCC 
CTGATCGGCG AGAGAATGGC CGACGACATA TTGCTGGTCA TGGCCAAGCG CGGCGGGCGA 
TACGTCGCGG GCGCGATAAA TTTTATTGGC GGCGATGCGC TTTATGGCCG ACACTGGGGC 
TGCATCGAGG ACCACCCCTT CCTGCATTTC GAAATCTGCT ACCATCAGGC CATCGATTAT 
GCGATCGCCA AGGGACTGAA ACGCGTCGAG GCCGGCGCTC AGGGAGAGCA CAAGCTTGCA 
CGGGGTTACA TGCCCGTGAC GACGCATTCC GCGCATTTCA TCAGCCATCC GGGACTTGCA 
CGCGCCGTTG CCGATTATCT GGAACGCGAG CGCCGGGATG TGGAAGAAAC CGGCGAGTTT 
CTTGCGGAGC ACGGACCTTT CCGCAAGGGT GAGCATCAGG ACAATTGA

Protein sequence

MTEAINIRIE HSFTSISPAS WSRLAGASKG QAGAPYNPFV SHAYLSALEE SGSATAETGW 
LGQHLLIEEA DGSLRGGLAC YIKSHSQGEY VFDHGWADAF ERAGGRYYPK LQCSIPFTPA 
TGPRLLAAEG CDQQMVRTAL AAGLKELTRR HHLSSAHVTF VPGDEIATLE QAGFLHRVDQ 
QFHFFNEGYG SHGDFIGTLA SRKRKALKKE RRAAVENGIT IDWLTGRDLT EEIWDQFFAF 
YMDTGGRKWG RPYLTRAFYS LIGERMADDI LLVMAKRGGR YVAGAINFIG GDALYGRHWG 
CIEDHPFLHF EICYHQAIDY AIAKGLKRVE AGAQGEHKLA RGYMPVTTHS AHFISHPGLA 
RAVADYLERE RRDVEETGEF LAEHGPFRKG EHQDN