Gene Rleg2_4474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4474
Symbol
ID	6977568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	107706
End bp	108833
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	62%
IMG OID	643393652
Product	basic membrane lipoprotein
Protein accession	YP_002278470
Protein GI	209546552
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.766807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAAC TCCTTTCCAT GAACCGCCGC AATTTCCTGC AGGCTTCCGC TGCCGGAGCG 
CTCGCCGGCG TCATGCCGGG CCTGATCGGC TCCTCCGCAG CGGCCCAAAC CGCGCTGACG 
ATCGGCTTCA TTTATGTCGG CCCCAAGGAC GACTACGGCT ACAATCAGGC ACATGCGGAA 
GGCGCGGCGG TGGTCAAGGC CCTGCCGGGC GTGACGCTGG TCGAAGAAGA AAATGTGCCG 
GAGACCGTCG ATGTCCAGAA GACCATGGAG TCCATGATCA ATCTCGACGG TGCGACCCTG 
CTCTTTCCGA CCTCTTTCGG CTATTTCGAC CCACACATGC TGGCCATGGC CGCCAAGCAT 
CCCGACGTTC AGTTCCGCCA TTGCGGCGGC CTCTGGCACG AAGGCAAGCA TCCGGCCAAT 
ACGGGCTCCT ATTTCGGCTA TATATTCCAG GGCCAGTATC TGAACGGCAT CGCCGCCGGC 
CATGCGACGA AGAGCAAGAA GATCGGCTTC GTCGCCGCCA AGCCGATCCC GCAGGTTCTG 
CAGAATATCA ACGCCTTCCT GCTCGGCGCG CGCACAGTCG ATCCTACGAT CACCTGCCAG 
GTGATCTTCA CCGGCGAGTG GTCGCTCGCC GTCAAGGAGG CCGAAGCCAC CAATGCCTTG 
GTCGACCAGG GCGCCGATGT CATCACCTGC CACGTCGACA GCCCGAAAGT GGTCGTCGAG 
ACGGCCGCGG GCCGCGGCGC CTTCGTCTGC GGCTATCACG CCAACCAGAG CCCGCTTGCT 
CCCGAAAAAT ACCTCACGGG CGCCGAATGG GCCTGGGGCA ACGTCTACAG CGACTTCGTC 
AAAAAGGCGC AGGCCGGCGA AAAGCTCGGC AATTTCGTGC GCGGCGGCCT GAAGGACGGC 
TTCGTCAAGA TGAGCGCGCT CGGCCCCGGC GTGTCGGCGG AGGGCCGCAA GGCCTTCGAA 
GCCACGCAGG CGGGCATGAT GAAGGGCGGC TTCTCGGTTT TCAAGGGACC GTTGAAGGAC 
AACAAGGGTG ACACCGTCGT GACTGCCGAC AAGAGCTACG CTGAAGACGC GATCGAGCTC 
GAAAGTATGA ATTATCTGGT CGAGGGCGTT GTCGGGTCCA CAGCGTAA

Protein sequence

MTKLLSMNRR NFLQASAAGA LAGVMPGLIG SSAAAQTALT IGFIYVGPKD DYGYNQAHAE 
GAAVVKALPG VTLVEEENVP ETVDVQKTME SMINLDGATL LFPTSFGYFD PHMLAMAAKH 
PDVQFRHCGG LWHEGKHPAN TGSYFGYIFQ GQYLNGIAAG HATKSKKIGF VAAKPIPQVL 
QNINAFLLGA RTVDPTITCQ VIFTGEWSLA VKEAEATNAL VDQGADVITC HVDSPKVVVE 
TAAGRGAFVC GYHANQSPLA PEKYLTGAEW AWGNVYSDFV KKAQAGEKLG NFVRGGLKDG 
FVKMSALGPG VSAEGRKAFE ATQAGMMKGG FSVFKGPLKD NKGDTVVTAD KSYAEDAIEL 
ESMNYLVEGV VGSTA