Gene Rleg_1903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1903
Symbol
ID	8012951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1888817
End bp	1889893
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	62%
IMG OID	644824492
Product	basic membrane lipoprotein
Protein accession	YP_002975724
Protein GI	241204628
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.94528
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.373123
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGT TAGCATTCAC ACTTGCCGCC TCGGCTGCCG CCGTGATCGG CATCTCTTCC 
GCCGCGCAAG CCGCGGACAA GACGAAGGTC TGCTTCGTCT ATGTCGGTTC GCATACCGAC 
GGCGGCTATT CACAGGCCCA CGACCTCGGC CGCCAGCAGA TCCAGGCCGA GTTCGGCGAC 
AAGATCGACA CGCCTTATCT CGAAAACGTG CCGGAAGGCC CGGATGCCGA GCGCGCCATC 
GAGCGCCTTG CCCGTTCCGG CTGCAAGCTG ATCTTCACGA CGTCCTTCGG CTTCATGGAC 
GCGACCGTCA AGGTCGCCGC CAAGTTCCCG GACGTGAAGT TCGAGCATGG CACCGGCTAC 
AAGGCCGGCC CGAACCTTGC GACCTACAAT TCGCGCTTCT ATGAAGGCCG CTACATCCTC 
GGCCAGATCG CCGCCAAGAC CTCGAAGAAT CACGGCGCGG CCTACATCGC CTCCTTCCCG 
ATTCCCGAAG TCGTGATGGG CATCAACTCG TTCGAACAGG GCGCCAAGTC GGTCGATCCG 
AGCTTCAAGC TGAAGGTCAT CTGGGTCAAC ACCTGGTTCG ACCCCGGCAA GGAAGCCGAT 
GCCGCCAAGG CGATGGTCGA CCAGGGCGTC GACGTCTTGA CGCAGCACAC CGACACGACT 
GCGCCGATGC AGGTCGCCGA AGAACGCGGC ATCCACGCCT TCGGCCAGGC CTCCGACATG 
ATCGCAGCAG GCCCGAAGGC TCAGCTGACG GCAATCGTTG ACACTTGGGG GACCTACTAC 
TCCAAGCGCG TTCACGCTCT TCTGGACGGC ACCTGGAAGT CCGAGCAGAG CTGGGACGGC 
CTGAAGGACG GCATCCTGAA GATGGCGCCC TATACCAACA TGCCCGACGA CGTGAAGAAG 
ATGGCCGAGG AAACCGAAGC CAAGATCAAG TCAGGCGAAC TGCATCCCTT CACCGGCCCG 
ATCAACAAGC AGGACGGAAC GCCCTGGCTG AAGGCTGGCG AGAAGGCCGA TGACGGCACG 
CTGCTCGGCA TGAACTTCTA TGTCGAAGGC GTCGACGATA AGCTGCCGGG TAAATAG

Protein sequence

MKKLAFTLAA SAAAVIGISS AAQAADKTKV CFVYVGSHTD GGYSQAHDLG RQQIQAEFGD 
KIDTPYLENV PEGPDAERAI ERLARSGCKL IFTTSFGFMD ATVKVAAKFP DVKFEHGTGY 
KAGPNLATYN SRFYEGRYIL GQIAAKTSKN HGAAYIASFP IPEVVMGINS FEQGAKSVDP 
SFKLKVIWVN TWFDPGKEAD AAKAMVDQGV DVLTQHTDTT APMQVAEERG IHAFGQASDM 
IAAGPKAQLT AIVDTWGTYY SKRVHALLDG TWKSEQSWDG LKDGILKMAP YTNMPDDVKK 
MAEETEAKIK SGELHPFTGP INKQDGTPWL KAGEKADDGT LLGMNFYVEG VDDKLPGK