Gene Smed_3991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3991
Symbol
ID	5317917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	443809
End bp	444924
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	64%
IMG OID	640775799
Product	secretion protein HlyD family protein
Protein accession	YP_001312732
Protein GI	150376136
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.713524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGAA AGATCAAAGG CGTAGCGTCC GCGGCGACCG CGCTCCTGGT GTTTGGAGTG 
GGGGCGTATT TTGGACGGGC ATGGTGGCAA GAGTTCCGCA TGCACGAACG GACGGACAAC 
GCCTATGTCC GCGCCGACAT CACCGCCATC AGTCCCAAAG TCGCCGGATA CGTATCCACG 
GTGCTGGTCG ACGATAACCA GGTCGTCGAA GCCGGCGCCA TTCTTTTGCG AATAGACGAC 
GATGACTATC TCGCTCAGCG AGATCGTGCG GCTGCGAGCG TCGCACAGGC CGAAGCAGCC 
GTAGGAAATC TGACACGCCG TAAGAGCCTG CAGCTCGCCA ATATCCGCGA GGCCGAAGCG 
ATGATCGATG TCGCCCGCGC GGATCTCGAG CTTTCGCGCC GGGAGCTGTC ACGAGCGACG 
CGCCTGGTCG ATCAGGGATG GACGGCGCAG CGGAACCACG ATACGGCGAC GGCGAAAGCA 
CAGAGTGCTC GCGCCACGCT CGTTCGCGCC GAAGCGGCGG CAGCGGCTGC CCGGGCGCAG 
CTGGCAGTGC TTGATTCGGA ATCTCCGCAG ATCTCGGCGC GCCTCGCCGA GGCGCGCGCA 
AACCTCCGAC TCGCGGAAAT TGCCCTTTCT GAAACGGTCA TCAGAGCGCC GGTGTCCGGA 
GTTGTCGGGA ACCGAAAAGT GCGCGAGGGC GAATATGTCC GGCCCGGCAG CGTTCTTCTG 
TCCGTGGTTC CCCTTGACGG CATCTGGGTC GTCGCCAATC TCAAGGAGAC ACAGCTTGCC 
CGCGTCATGC CTGGCCAACG TGCCGAAATC CGCGTGGACG GTTATTCGAC GACGGTGATC 
GAAGGACGCG TAGACAGCCT GGCACCCGCA AGCGGCGCCG CCTTCAGTCT TTTACCACCG 
GACAATGCGA CCGGGAATTT CATCAAGGTC GTTCAGCGCG TGCCCGTCAA GATCCGGCTT 
GAGCCCGATC ACGCTTTTCA GGGCCGGCTC GTCCCGGGTC TGTCGGTGGA CGTCGCCATA 
CACCTGGCTC CCGAGCCCGA GCGGCCACCC TCCCAAAGCA ATCCGGTCGC CGCTGGCCGC 
CCGACTTCAT CCCTAACTGC CAGGAGAGAG CCATGA

Protein sequence

MKRKIKGVAS AATALLVFGV GAYFGRAWWQ EFRMHERTDN AYVRADITAI SPKVAGYVST 
VLVDDNQVVE AGAILLRIDD DDYLAQRDRA AASVAQAEAA VGNLTRRKSL QLANIREAEA 
MIDVARADLE LSRRELSRAT RLVDQGWTAQ RNHDTATAKA QSARATLVRA EAAAAAARAQ 
LAVLDSESPQ ISARLAEARA NLRLAEIALS ETVIRAPVSG VVGNRKVREG EYVRPGSVLL 
SVVPLDGIWV VANLKETQLA RVMPGQRAEI RVDGYSTTVI EGRVDSLAPA SGAAFSLLPP 
DNATGNFIKV VQRVPVKIRL EPDHAFQGRL VPGLSVDVAI HLAPEPERPP SQSNPVAAGR 
PTSSLTARRE P