Gene Rleg_5448 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5448
Symbol
ID	8016757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012853
Strand	+
Start bp	25337
End bp	26617
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	54%
IMG OID	644827621
Product	hypothetical protein
Protein accession	YP_002978821
Protein GI	241518193
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0547483
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0192928
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTATT TTTTGATCCC GAAAGTCGTC GCGTTACTTG CAGTTCTTGG CACGGTGCAA 
TCTTGCTCGT CGGTATATTC GTCGTCGGCA TTGGAGGTAT CCGCAACGTC GGGGACGTCC 
GAGTGCCTCG CAAATATGGG AACCTATTTT CTTCCCAAAG GAGAGCTTTC GTTCGTTGTT 
CTGAAAAAGC CGACGATAGG CATGACAGGC TTCCGATACG ACATGAAGAC CGTCGCCGAC 
AACACTGGTA CCGACGGACT ATCCGTGGTC ATGTCGCCTG ACGAACGCCA CCAGTACTGC 
CTCGACTTCA AGCCTAATTC TTCGTACTCC GACGTGGTCC GCGCGCAGCG CAACGAACTT 
GGACTCCTGA CAAGTGTCTA CAGCAATGTC GAGGATCAGA GCAAAACCAT CGTAGAGGAT 
ACCGCACGAG GCATTGCGTT GGCAGTAGCG GCAGAATCCC GGCTCGCTAA TAGAGACTTT 
TTGGTCGCCG ACCCGGCGAC TGTCGTTCAC ATGAAGATGC AATTCGATCC TTTCGATCTG 
GATCGCATCA CCAGCGTAAA CCGGGCGCTC GAAAAAAGCG GTTATTGCAT CTACATCGAT 
CCCAAAAGCG ATCCCTTTGT TCCGTTCTGG ATGCGAAATC AATGTTCATC CACTCCGCAG 
CTCGTCGCTT ACAATTTCAA GGGGGACGCG GAAGAGGTCT TTAGTTCCGC GAGCTACACT 
GCAGGCGAAG GCCGGTTCGG CATCCTCTAC AAGCCTGCAT TGAGCCACAC TCTGGTTATC 
CTCAAGCGTG ACGATCCAAC GTCAGGGAAG CCATGGCGCA TCTGGAAGCG CCAGATTGTC 
GAGTTGCCTA ACCGTGCGCC TGTTTTCATG CTGCAGGTGA GCCGCGGCTT CTTCACCGCC 
CGCAAGAGCG AGATAACGTT CCAAAACGGG ATGCTCGCCA GTGTCGAAGT TGATAAGAAG 
AGCGAGCTGA AGGCCGTGTC GGAAGCGTTT GTGAACGTGG TTAGTATCGT CGTGAGAATT 
CCGGCCAAGG CCCTTATCAT CGGAACCAAC GAGGCAAAAA ACCAGGAAGC GCTCATCAGG 
GCAAACCAGG CTCTTCTGCA AGCGTACGCA GAATTGGAAG CCGAACAAAG GAAACAGGCT 
AACCTCAAAC AAGGCCTCGA CGTAGATGGC CTTCCCAGAA CCTCGTCCGC ACGCACGAGA 
GCAGCCTGCC TCGATTATGC TGACCTCAGC GCGGTGGAAG ACCCGAACGT ATACTGTCAG 
GACAAGGCCG AGACGCAATG A

Protein sequence

MSYFLIPKVV ALLAVLGTVQ SCSSVYSSSA LEVSATSGTS ECLANMGTYF LPKGELSFVV 
LKKPTIGMTG FRYDMKTVAD NTGTDGLSVV MSPDERHQYC LDFKPNSSYS DVVRAQRNEL 
GLLTSVYSNV EDQSKTIVED TARGIALAVA AESRLANRDF LVADPATVVH MKMQFDPFDL 
DRITSVNRAL EKSGYCIYID PKSDPFVPFW MRNQCSSTPQ LVAYNFKGDA EEVFSSASYT 
AGEGRFGILY KPALSHTLVI LKRDDPTSGK PWRIWKRQIV ELPNRAPVFM LQVSRGFFTA 
RKSEITFQNG MLASVEVDKK SELKAVSEAF VNVVSIVVRI PAKALIIGTN EAKNQEALIR 
ANQALLQAYA ELEAEQRKQA NLKQGLDVDG LPRTSSARTR AACLDYADLS AVEDPNVYCQ 
DKAETQ