Gene Rleg_5717 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5717
Symbol
ID	8016680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012853
Strand	+
Start bp	298869
End bp	300149
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	55%
IMG OID	644827866
Product	hypothetical protein
Protein accession	YP_002979066
Protein GI	241518438
COG category	[S] Function unknown
COG ID	[COG4949] Uncharacterized membrane-anchored protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0570912
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.514525
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCAA AGGGCGCAGA GGAAGCATTC TTCCCAACGG GGTCTGCTTC CGCACCACAG 
GTGTCTCGTC CAGCTGCTTT TGAACAGAAG CCCGCAGACT TCAACTCGGA GCTTCACGCT 
CGACCGTCGA TTTATTTCAC CGGTCCGGCG ATCGTCGAAC ACTTTGCTTT CATGCCGTCG 
GATGGCGTGA TCAAGGAGTT CCACGATAGT CTCCAAGCTG ATGGTGGAAT TTCCGTCAGA 
GTGGAACGGC ACACTGAGTT CGTGACTGTC ACGCGGGTCC GAAAATTGGC CAGCGAGCCC 
GAGGATTGGC CGGAAACTGA CCTTTGTGAA GGTGATTTTG CGCGGCTAGC AGGGTTGAGC 
TCTCCTCTCC TCGTTTGCCA CGTGAGTATC CTTGTCCTCG GAAACCCTCC GGACCAGCTG 
GGAACGGTTC TAAAATCCCT CGACTTCGGC GACACCGCCG CGTCATCAAT CGGCGGCGGG 
GCGGCGCAAG TTTGCTCCGA TTTTCGCGTT CGAGGGGACA ATTCAAGCAG GATCATCCTG 
TTCAACAAGG ACCTGAATGC ACATCGGCTG GGGCGCATGG TACGGCGGAT CTTTGAGATC 
GAAACCTATA GGTCAATGGC GCTGCTCGGA TTGCCGGAGG CGCGTCGTCT TGCCCCGCTT 
CTGGGCGGAT ATGACGCGGA GCTCGTTCGG CTGACCAATC GAAACTTGAG TACGCCTGCA 
CATCAGCACA AACAATTGCT CGAGGAAATT ACTGTTCTCT CCTCGCATAT CATTTCAGCC 
ACCGCGGAAA CCAGAAACAG GTTTGGCGCA ACCGCTGCCT ATGCCAAAAT CGTTGAAGAA 
AGGATCGCCC TTTTACGGGA AACCCATGTC CCCGGCTTTC AACGTTTCGG TACCTTCGTG 
GAGCGCCGGT TCAAGCCTGC GGTGCGTACC TGCGAAGCAA CCGCGTTGAG GCTTGAGCAC 
CTATCAAGGG CTGCGATGCA CCTGCTCGAC CTGCTACAAA CCCGAATCCA GGTCGAGATT 
GAGTTCCAGA ACTCTACACA GATCCAGGCG ATGGCTGATC GGGCCGCGAC GCAGGTCAAG 
ATCCAGCGCG CGGTCGAAGG CTTTTCGATG ATCGCGATTA GCTACTACTT GCTGAGCTTG 
CTGAAATTTA TATTTGAGAC AGCAGACCAC GCAGGATTCC ATTTCGATCC GATGATCATG 
CTCGTCGCTG TTCCGGTGGT TGTAGGATCT GTTGTGATTA CCATCCTCCG CGTCAAGCAT 
GCCTTAAAGG CAGAGAGCTA G

Protein sequence

MNSKGAEEAF FPTGSASAPQ VSRPAAFEQK PADFNSELHA RPSIYFTGPA IVEHFAFMPS 
DGVIKEFHDS LQADGGISVR VERHTEFVTV TRVRKLASEP EDWPETDLCE GDFARLAGLS 
SPLLVCHVSI LVLGNPPDQL GTVLKSLDFG DTAASSIGGG AAQVCSDFRV RGDNSSRIIL 
FNKDLNAHRL GRMVRRIFEI ETYRSMALLG LPEARRLAPL LGGYDAELVR LTNRNLSTPA 
HQHKQLLEEI TVLSSHIISA TAETRNRFGA TAAYAKIVEE RIALLRETHV PGFQRFGTFV 
ERRFKPAVRT CEATALRLEH LSRAAMHLLD LLQTRIQVEI EFQNSTQIQA MADRAATQVK 
IQRAVEGFSM IAISYYLLSL LKFIFETADH AGFHFDPMIM LVAVPVVVGS VVITILRVKH 
ALKAES