Gene Rleg2_0834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_0834
Symbol
ID	6979552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	852853
End bp	854043
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	66%
IMG OID	643395545
Product	secretion protein HlyD family protein
Protein accession	YP_002280354
Protein GI	209548437
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.541495
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGAGT TGCCCCGCAA GGATGTTTTC GACACGGCCC GGCAGGCCGA TGGCGCGCCT 
GCGACCGAAG CGGCTGTCGT CGAAGCCCCA GCCGCGGCCG TGCCGAAGAA AACCGGCCGC 
AAGATTGTCA AGCGCGCGGT CATCGCCGCA GCCCTGCTTG CCGGCGTCGG TTTATCAGGC 
GATTTCGGTT ACCGCTATTG GACGGTCGGC CGCTTCATCG AATCCACCGA CGATGCCTAT 
GTGAAGGCCG ATTACACCAC CGTCGCCCCG AAGGTTGCCG GCTATATCAG GCAGGTGCTG 
GTCAACGACA ACGACCCGGT CAAGTCAGGC CAGGTTCTCG CTCGCATCGA CGACCGCGAC 
TTCCAGGCCG CATTGTCGCA GGCGAGGGCC GCCGTGAAGG CGGCCGATGC CGCGATCGCC 
AATATCGACG CCCAGATCGC CTTGCAGCAG TCGGTGATCG GCCAGGCCAA GGCCACGATC 
GATGCCTCGC AGGCCTCGCT CGATTTTGCC GTTTCGGATG CTGCCCGCTC GGCCCGGCTG 
ATCACCAGCG GCGCCGGCAC GCAATCGCGC GCCGAACAGA GCCAGTCGGC CCGCGACCAG 
GCCGCCGCCG CCGTCGAGCG CGACCGGGCA GCCCTCGTCG CGGCTGAGAA CAAGGTGCCG 
GTCCTTGAAA CGCAGCGCCA GCAGGCAATT GCCGAGCGCG ATCGGGCGGC AGCCGCCGCC 
CAGCAGGCCG AACTCAACCT GTCCTATACT GATATCGTCG CCGCCGTCGA CGGCACGGTC 
GGCGCCCGTT CGATCCGCGT CGGCCAGTAT GTCACCTCGG GCACGCAGCT GATGGCCGTC 
GTGCCGCTGC ATGCCGTCTA TGTCGTCGCC AATTTCAAGG AGACGCAGCT GACCCATGTC 
CGCCCCGGCC AGCCGGTCGA GATCAAGGTG GACAGCTTTC CCGACATGGC GATCAAAGGC 
CATGTCGACA GCGTTTCACC GGCGAGCGGC CTCGAATTCT CGCTGCTGCC ACCTGACAAC 
GCCACCGGCA ATTTCACCAA GATCGTCCAG CGCATCCCGG TCAAGATCGT CATCGACGAC 
GAGGCGCTGA GCGGCCTGTT GCGCTCGGGC ATGTCGGTCG AGCCGGAGAT CGATACCAAG 
GCTGCAGAGA CCTCTGTGGC CGAGGAAGAA TTATCCCGGC ACGCCGGATA G

Protein sequence

MVELPRKDVF DTARQADGAP ATEAAVVEAP AAAVPKKTGR KIVKRAVIAA ALLAGVGLSG 
DFGYRYWTVG RFIESTDDAY VKADYTTVAP KVAGYIRQVL VNDNDPVKSG QVLARIDDRD 
FQAALSQARA AVKAADAAIA NIDAQIALQQ SVIGQAKATI DASQASLDFA VSDAARSARL 
ITSGAGTQSR AEQSQSARDQ AAAAVERDRA ALVAAENKVP VLETQRQQAI AERDRAAAAA 
QQAELNLSYT DIVAAVDGTV GARSIRVGQY VTSGTQLMAV VPLHAVYVVA NFKETQLTHV 
RPGQPVEIKV DSFPDMAIKG HVDSVSPASG LEFSLLPPDN ATGNFTKIVQ RIPVKIVIDD 
EALSGLLRSG MSVEPEIDTK AAETSVAEEE LSRHAG