Gene Rleg_0214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0214
Symbol
ID	8011441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	224903
End bp	226894
Gene Length	1992 bp
Protein Length	663 aa
Translation table	11
GC content	66%
IMG OID	644822807
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_002974064
Protein GI	241202968
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.287216
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAAC ATCTGAAAAT CCGCACAAAA ATCATATCGG TCGTGGCGCT CATGGGGCTG 
ATCACGATGG CCGGGCTGAT CTATGTCATC TCCGAATTCC GCCGTGCGGA TGCGGCCTAC 
AGCGCCTTCA TCGATCATGA AGCGCAGGCC TCGATGCTGA GCGCGCGCGC CAGCGCATCG 
GCGGTGGCCT CGGTGCTGCA GGTCACCCTG ATTGCCGACA TGAAGCCCGA TACGCCGGCA 
TTCCAGACGG CGCTCGCCAC ACCGAGCAAG CTGCCGCAGG CGCGTGACCG CATGAAGCAG 
GCGCTGGCGC TGGTGCCCAG CCGCAAGCCG GCGATCGATG AGATTCAGGC CGGCATCGAT 
GAGATCGAAA CCCTGGCAAA CAAGATCATC GAACAGAGCA AGGCCAAGGA CAGCGCCGGC 
GCGCTTTCGA ATGTTGCCCT GATCAATGCC AAGCTCGATG CGCTGACGCC GAAGATGATC 
GCCAACAATG ATGCGATGAT GGCAATGCTC AACGATGGCG GCGACGCGCT CTCGGCTTCC 
GTCAACGGGC GGATCGTCTT CTGTTTCGTG CTGATCGGCA TCGCCGTTCT CGCCGCCGTC 
GGCTTCAGCG TGGTCGTCGC CCAGAAGGGC ATCGCCGGCC CGATGACGCA GCTGCGCCTG 
CGCATGACCC GGCTTGCCGA GGGCGATACG ACAAGCGATG TCAGCGGCCT CGACCGCGGC 
GACGAAGTCG GCCAGATGGC AAAGGCGGTT TCGGTCTTCC GCGACAATGC GATCGAGCGC 
GCCCGGATCG AGGCGCGCGC CGAAACAGAC CGCGACGTCA GCGACAGCGA GCGCCGCGAC 
CGCGAGGCGC AGAAGGCCCG CGAAGCATCG GAACTCGACC GCGCCGTCAC CGCACTCGGC 
GACGGCCTGC GCCGCCTTGC CGCCGGCGAT CTCGCCTCGC ATATCGCGGA GCCCTTCGTC 
GCGCATCTCG ATGCGCTGCG TGAGGATTTC AACAACTCGG TCGAGAAGCT CAACGAAACC 
CTGCATACGG TCGGCGCCAA TGCCCGGGCG ATCGGCGCTG GCGCCAACGA GATTCGTTCC 
TCCGCGGACC AGCTTTCCCA GCGGACGGAA CAGCAGTCAG CCTCCGTCGA AGAGACGGCA 
GCAGCGCTGG AGGAGATCAC CACGACGGTG CGCGACGCCG CCAAGCGGGC CGAGGAAGCA 
AGCCAACTCG TCGCCCGCGC CCGCCTCGGC GCCGAGAAAT CCGGCGAGGT CGTCCGCAAG 
GCCGTCTCCG CCATGCAGCA GATCGAGAAG TCCTCGGGCG AAATCTCCAA CATCATCGGC 
GTCATCGACG ACATCGCCTT CCAGACCAAC CTTTTGGCTC TGAACGCCGG CGTCGAAGCC 
GCCCGCGCCG GCGATGCCGG CAAGGGTTTT GCGGTCGTCG CCCAGGAAGT GCGCGAGCTC 
GCCCAGCGCT CGGCCAAGGC GGCCAAGGAG ATCAAGGCGC TGATCAGCAC CTCCGGCTCG 
CATGTGCAGA CCGGCGTCTC GCTGGTCGGC GAAACCGGCA AGGCGCTCGA CGCGATCGTC 
CAAGAGGTGC AGGAGATCAA CCAGCACGTC CACGCGATCG CCGAAGCCTC CCGCGAACAA 
TCGATCGGGC TGCAAGAGAT CAACACCGCC GTCAACACCA TGGACCAGGG CACGCAGCAG 
AATGCGGCGA TGGTCGAAGA ATCGACAGCC GCCAGCCATA ACTTGGCTAC GGAAGCGTCA 
GCGCTCAACA ATCTGCTCGG CCAATTCAGG CTGACCGGCA CCGGCGGCTT CACCACGAGT 
ACTCCAATCG CCGCAGCAGC ACCTCGCGCT GCCGCCCGCC CGGCAGCCAG GGCAGCCCCG 
GTCCGCGTCG CTCGCGAAGG CACCGCCCGC CCGGCCGCCT CACCGGCCCG CGCGCTCGGT 
CAGAAGATCG CCAACGCCTT CGGCGCCGGC AGCACATCGC CGAGCCAGGA TCCCGACTGG 
ACGGAATTCT GA

Protein sequence

MLKHLKIRTK IISVVALMGL ITMAGLIYVI SEFRRADAAY SAFIDHEAQA SMLSARASAS 
AVASVLQVTL IADMKPDTPA FQTALATPSK LPQARDRMKQ ALALVPSRKP AIDEIQAGID 
EIETLANKII EQSKAKDSAG ALSNVALINA KLDALTPKMI ANNDAMMAML NDGGDALSAS 
VNGRIVFCFV LIGIAVLAAV GFSVVVAQKG IAGPMTQLRL RMTRLAEGDT TSDVSGLDRG 
DEVGQMAKAV SVFRDNAIER ARIEARAETD RDVSDSERRD REAQKAREAS ELDRAVTALG 
DGLRRLAAGD LASHIAEPFV AHLDALREDF NNSVEKLNET LHTVGANARA IGAGANEIRS 
SADQLSQRTE QQSASVEETA AALEEITTTV RDAAKRAEEA SQLVARARLG AEKSGEVVRK 
AVSAMQQIEK SSGEISNIIG VIDDIAFQTN LLALNAGVEA ARAGDAGKGF AVVAQEVREL 
AQRSAKAAKE IKALISTSGS HVQTGVSLVG ETGKALDAIV QEVQEINQHV HAIAEASREQ 
SIGLQEINTA VNTMDQGTQQ NAAMVEESTA ASHNLATEAS ALNNLLGQFR LTGTGGFTTS 
TPIAAAAPRA AARPAARAAP VRVAREGTAR PAASPARALG QKIANAFGAG STSPSQDPDW 
TEF