Gene Rleg2_4040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4040
Symbol
ID	6982811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	4213905
End bp	4215062
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	61%
IMG OID	643398770
Product	secretion protein HlyD family protein
Protein accession	YP_002283528
Protein GI	209551611
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTGC TCCTGATACT CACCTACGCC GCGATCTGTT GGGCAATCTT CAAAATATTC 
AGGATCCCGG TAAACCAGTG GACGCTCGCA ACCGCCGTCC TTGGGGGGAT CTTCCTTCTG 
TCTACCCTCC TGCTCCTGAT GAGCTACAAC CATCCCTATT CGAGCGACGG CCGCATCTAT 
TTCACCTCCG CGCCGGTTAT TCCCGTCGTC GGAGGCCAGG TGGTCGAGGT GCCGGTGACA 
CCGAATGCGC CTCTCAAAAA GGGCGATATC CTCTTTCGCA TCGATCCGCG GCCCTATCAG 
TTTACCGTCG ATCAAAAGAA AGCGGCGCTC GCCGAGGCTG AGCAGTCCGT CCTGCAGTTG 
AAAGCCGCCA TGGATGCCGC CGAATCAGGG GTCACGGGCG CCGAGGCCAC GAGGGACAGG 
TCACAGCAGG CCTTCGAAAA GTTCCAGCAG ACGAACGAGA ATGCGAAGTC GAGCGGCAAG 
GGTGCGGCCT TTTCCGAACT CGAGGTCGAA AACCGACGCG GCATCTACCT GACATCGGAG 
GCTGCGGTCG CCACGGCCCG CGCGCAAGCG GTGCAGGCAA AGCTTGCCTA TGAGTCCGAG 
ATCGACGGAA CCAACCCGAC AGTCGCAAGG CTGCAAGCGG AATTGCACAA TGCCGAGTAC 
GAACTCGACC AGACGGTTGT GCGGGCGCCG ACCGATGGCT ACGTCACGCA GGTCTTCCTG 
CGCCCTGGAA TGATGGCCAA CCCGCTACCC CTGCGGCCGG TCATGGTGTT CATCGACAGT 
CAGGACCGCA TGCTGGCGGC AGCCTTCATC CAGAACTCGC TGCAGCGCGT CCGTGTCGGC 
GATGAGGCGG AGGTCTCTTT CAAAGCCGTG CCCGGCAAGA TTTTCAAGGC GCGGGTTCAG 
GAGGTCATCG ATGTGATGGC CCAGGGCCAA CTGCAGCCGA GCGGTGCGCT GATCGATCCG 
CAATCGCCCG AGCGCGTCTC GCCGGGACAG ACGCTGGCTC GGATCGAGTT GCTCGAAAGT 
ACCGACGAAT ATCAACTGCC CGGCGGCGTC GTCGCCGAGG TCGCGGTCTA CACCCATCAT 
TGGCACCATG TCGCTGTCCT TCGCAAGGTG CTGCTGCGGA TGAGCAGCTG GATGAACTTC 
GTGTTCCTCG AACACTAA

Protein sequence

MDLLLILTYA AICWAIFKIF RIPVNQWTLA TAVLGGIFLL STLLLLMSYN HPYSSDGRIY 
FTSAPVIPVV GGQVVEVPVT PNAPLKKGDI LFRIDPRPYQ FTVDQKKAAL AEAEQSVLQL 
KAAMDAAESG VTGAEATRDR SQQAFEKFQQ TNENAKSSGK GAAFSELEVE NRRGIYLTSE 
AAVATARAQA VQAKLAYESE IDGTNPTVAR LQAELHNAEY ELDQTVVRAP TDGYVTQVFL 
RPGMMANPLP LRPVMVFIDS QDRMLAAAFI QNSLQRVRVG DEAEVSFKAV PGKIFKARVQ 
EVIDVMAQGQ LQPSGALIDP QSPERVSPGQ TLARIELLES TDEYQLPGGV VAEVAVYTHH 
WHHVAVLRKV LLRMSSWMNF VFLEH