Gene Rleg_3559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3559
Symbol
ID	8014420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	3593352
End bp	3595160
Gene Length	1809 bp
Protein Length	602 aa
Translation table	11
GC content	62%
IMG OID	644826124
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_002977344
Protein GI	241206248
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.495549
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.432808
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATCA CGATCAAGCT TAAGCTCGCG GCCGCGTTCG GCTTCGTCAT TTTGTTGCTG 
GTGGGCAGCG CGGTGTATGG GATCATCAGC CTCAGCACAC TGAACGACGC CGTCGGCAAC 
CTTGTCGCGG GTCCTGCAAA AAGCCTGGAA CTGGCCCTGG AAGCAAAAGC TGCGGAGCTC 
AGTGCCATTC GCTGGCAGAA GAATGCCCTT CTGGAAATGG ATCCCGAAGT GGCCAGGAAG 
AACTACCAGA ACTCGGCGAA GAGCATGGAC GAAATGCTGG CCTATGCGGT GAGTGGCCAA 
CAGCTTGCAA CTGTCGACGG CAAGCCCACG TGGGATAGGC TGATCGAACT GGCCAAGCGT 
TTCACCGAGG GCTCCCACAA AGTCGCCTCC ATCCAGGAAA GTGGTGACAG GGCAGGGGCC 
AATGCCCTGT CGTCGGGAGA GGTTCGCGCC CTCGTTACGG AACTGGAAGA CGTCTTCGCG 
GCGCTCGTTG CGCAGCAGCA GAAGTCAATG GCGCAGGCCG ATGACGATAC CGAAACCCTT 
TATGGTTCCA CCAGGAACCT GCTGATCGGC ATCGCCGTCG GCGCCTCCGT CATCGCTTTT 
GCCGCCGCAT TGTGGATCGC CCTCGGCATC AACAGCGGCC TGCGTAAGAT CATGAACGTC 
GCCAACGCCG TCGCCACCGG CGACCTGAAC CAGAAGGCCG AGATCAACAG CAACGACGAG 
ATCAAGGACC TGGTGAACAC GATCAACGTC ATGACGGATA ATCTTCGCAG CACTGCTGGT 
ATCGCCAGCC AGATCTCGAA CGGCGACTTG ACCGTGTCGC CGAAGCCGCT TTCTGACAAG 
GACATGCTGG GCATTGCGCT CGAGCAGATG GTCGAGCGTC TGCGCGGTGT CGTCTCTGAT 
GCGGCGGCTG CCGCAGAAAA TGTTTCGGCC GGCAGCCAGG AACTGTCCTC GAGCTCCGAG 
CAGGTATCGC AGGGCGCCAC CGAACAGGCG GCTTCGGCCG AAGAGGCTTC CGCCTCGATG 
GAAGAGATGG CCGCCAACAT CAAGCAGAAC GCCGATAACG CCGCCCAGAC CGAAAAGATC 
GCCCGCCAGT CGGCCAAGGA TGCTGAAGCC AGCGGGGACG CGGTGACGCG CGCCGTACAG 
GCGATGCGGA CCATTGCCGA GAAGATCGGT ATCGTCCAGG AAATCGCCCG CCAAACCGAT 
CTCTTGGCTC TCAATGCCGC CGTCGAAGCT GCTCGTGCAG GCGAACACGG CAAGGGCTTT 
GCGGTGGTGG CTTCGGAAGT GCGCAAGCTT GCCGAACGCA GCCAGTCGGC TGCTGCCGAA 
ATCAGCTCGA TGTCGGGCGA TACCGTCAAG GCCGCTCAGG AAGCGGGCGA CATGCTTGGC 
CGGCTGGTGC CGGATATCCG CAAGACGGCG GAACTGGTCT CCGAGATCAG CGCCGCCTGC 
CGCGAACAGG ATGTCGGCGC TTCGCAGATC AACGAAGCGA TCCAGCAGCT CGACAAGGTG 
ACGCAGCAGA ATGCCGGCGC CTCCGAGCAG ATGTCCGCAA CCTCGGAAGA GCTCGCGACT 
CAAGCGGAAG AATTGCAGGC CTCGATCGCC TTCTTCAAGG TCGATACTGC AGGCAACCGC 
CAGTCCCGCA CGCCGGCCGC CAGGATGACG GTTCGCAGCC CGGCTCCGGC CGCCGGCCGC 
AAGCCTGCAC CCAAGAAGCC GGCCGCCAAC AGCGTCGCCG GCCAGCAGGC GCGGGCGAAA 
GGCTTCGCTC TCGATCTCTC CATGGGCGGT CCCGATGACG GAGACGCCGA ATTCAAGGAA 
AGCGCATGA

Protein sequence

MRITIKLKLA AAFGFVILLL VGSAVYGIIS LSTLNDAVGN LVAGPAKSLE LALEAKAAEL 
SAIRWQKNAL LEMDPEVARK NYQNSAKSMD EMLAYAVSGQ QLATVDGKPT WDRLIELAKR 
FTEGSHKVAS IQESGDRAGA NALSSGEVRA LVTELEDVFA ALVAQQQKSM AQADDDTETL 
YGSTRNLLIG IAVGASVIAF AAALWIALGI NSGLRKIMNV ANAVATGDLN QKAEINSNDE 
IKDLVNTINV MTDNLRSTAG IASQISNGDL TVSPKPLSDK DMLGIALEQM VERLRGVVSD 
AAAAAENVSA GSQELSSSSE QVSQGATEQA ASAEEASASM EEMAANIKQN ADNAAQTEKI 
ARQSAKDAEA SGDAVTRAVQ AMRTIAEKIG IVQEIARQTD LLALNAAVEA ARAGEHGKGF 
AVVASEVRKL AERSQSAAAE ISSMSGDTVK AAQEAGDMLG RLVPDIRKTA ELVSEISAAC 
REQDVGASQI NEAIQQLDKV TQQNAGASEQ MSATSEELAT QAEELQASIA FFKVDTAGNR 
QSRTPAARMT VRSPAPAAGR KPAPKKPAAN SVAGQQARAK GFALDLSMGG PDDGDAEFKE 
SA