Gene Smed_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2034
Symbol
ID	5322893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2084076
End bp	2085287
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	65%
IMG OID	640790971
Product	RND family efflux transporter MFP subunit
Protein accession	YP_001327702
Protein GI	150397235
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTTTT GGAATCAGCT CGCGATCAGC GTCGTCGTCC TCGCCGTCGG GGGCGCGGCC 
TGGGTGCGTT TTGCACCCGG AGCGGGCGAG ACCTTGGCCG CGATCGGCGT TTCGCAGCCG 
TTGATCGATG CCCTGTCAGG GCCGCAGGAC GGCCAAGCGG GACGCGGCGG TTCCGGTAAT 
GCCGGCCGCG GGCAGGGCGG ACGCGGGCAG GGGGGGCTTG GCGGCTTTGC GGACGTTCCG 
CTGGTCGTCG TCCGGCCGGC CGCGAGCTCA CTCGTCAACG ACAGACTGAA TGCCATCGGC 
AACGGCGAAG CGATCCGTTC GGTTACGGTT ACGCCGACCG CAACCGGAAA CCTCACGGAA 
ATACTGGTAA AATCGGGTGA CAGGATCGCG GAAGGCCAGG TAATCGCCCG TCTCGACAGC 
GACGATCAGA TGATTGCTGC CGAGCAGGCA CGGTTGACCC GCGACAGCGC CCGGGAAAAA 
GTCGAGCGCT ACCGCAATCT CAGCACCGCG CGCGCAGTGA CGGCGGTCGA AGTGCGTGAC 
GCCGAATTTG CGCTGCAGGC GGCCGAACTG GCGCTGAAAA CGGCCGAACT CGACCTGAAG 
CGGCGCGATA TCGCAGCGCC TTCAAAGGGC GTCGTGGGCA TCATCACCGT CAATATAGGA 
GATTACGTCA CGACATCGAC GCCGATCGCG GTGGTTGACG ACCGTTCGCA AATCCTGGTC 
GATTTCTGGG TTCCAGAGCG CTTCGCGGGC AAGATCTTCG TCGATCAGCC GGTGACCGCG 
AACGCGATCG CGCGGCCAGC CCGCGCACTC CAGGGCGTTG TTCATGCGAT AGACAACCGC 
CTGGACCCGG AGAGCCGAAC GCTCAGGGTC CGGGCAAGAC TCGAGAATCC GGACGACATG 
CTGCGCGCCG GCATGTCCTT CTCGGTCACA GTGGCATTCG AAGGTGATCG TTATCCCACC 
GTCGACCCGC TGGCGATCCA GTGGAGCTCC GAAGGATCCT TTGTCTGGCG CGTCAATGGC 
GACAAGAGCG AGCGTGTGCC GATCAAAATT ATCCAGCGCA ACCCCGACAA GGTGCTCGTG 
GAAGCGGAAC TCGCCGAGGG CGACCGAGTC GTCACCGAAG GCGTGCAGCG GCTGCGCGAC 
GGCGGCGCCG TGCGCATTGC CGGCGAGCCT GCGGCCGAGG CCGGGCAGAA GGTTGCGGGA 
GACGCGCAAT GA

Protein sequence

MRFWNQLAIS VVVLAVGGAA WVRFAPGAGE TLAAIGVSQP LIDALSGPQD GQAGRGGSGN 
AGRGQGGRGQ GGLGGFADVP LVVVRPAASS LVNDRLNAIG NGEAIRSVTV TPTATGNLTE 
ILVKSGDRIA EGQVIARLDS DDQMIAAEQA RLTRDSAREK VERYRNLSTA RAVTAVEVRD 
AEFALQAAEL ALKTAELDLK RRDIAAPSKG VVGIITVNIG DYVTTSTPIA VVDDRSQILV 
DFWVPERFAG KIFVDQPVTA NAIARPARAL QGVVHAIDNR LDPESRTLRV RARLENPDDM 
LRAGMSFSVT VAFEGDRYPT VDPLAIQWSS EGSFVWRVNG DKSERVPIKI IQRNPDKVLV 
EAELAEGDRV VTEGVQRLRD GGAVRIAGEP AAEAGQKVAG DAQ