Gene Rleg2_5530 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5530
Symbol	flgK
ID	6978624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	1178683
End bp	1180143
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	62%
IMG OID	643394629
Product	flagellar hook-associated protein FlgK
Protein accession	YP_002279447
Protein GI	209547529
COG category	[N] Cell motility
COG ID	[COG1256] Flagellar hook-associated protein
TIGRFAM ID	[TIGR02492] flagellar hook-associated protein FlgK

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0345523
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTCA CCTCCGGCTT GAACAGCGTC CAGAGTATTT TCAACAATAC GGGCCAGCAG 
AGCAGCGTCG TCTCGACCAA CATCGCCAAT GTCGGGAATT CCGACTATGT GAGGCGGGAG 
GCGTCGATCA CGACGTCTCT CTCAGGCGCC CAGGTCGTCA GCATCAGCCG GGCGCAGGAA 
ACTGCGCTGC TGGCGCAATA TCTGCAATCG AACTCCAAGG ACAGCGCCCA GCAGACGCTG 
GTGACCGGCC TCGAAAGCTT GAAGTCGCTG ATGGGCGGCA ACGATTACGA GACCTCGCCA 
AGCACATACC TCTCAGCATT TCAGCAGGCG CTGCAGACCT TTGCCACATC GCCGAGCAGC 
ACGACCGCGG CGCAATCGGC CGTCACCGCC GCGCGGGATC TCGCCAATTC GCTGAATACC 
GCAAGCGACG GCGTCCAGTC GATCAGGGCC GATGCCGACG CGGAGATCGC CACGCAGGTC 
TCCTCGCTGA ATACACTGCT GTCGCAGTTC GAGACGGCCA ACAATGCCGT CAAGTTGGCG 
ACGGCGACAG GCGCCGATAC CTCCTCGGCG CTCGACGAAC GAGAAAAACT GTTGAAGCAG 
ATCTCCTCGA TCGTCGGCGT CACCACCGCC GTGCGCGACA ACAACGACAT GGCGCTCTAC 
ACCTCCGACG GCACGGTGCT GTTCGAGACC GTACCGCGCA CCGTCACATA CGTGCCGACG 
ACAACCTATG TGGCCGGAAC GGAGGGCAAT TCGGTCTATA TCGACGGCGT CGCACTCGAC 
GCCGGCGAGG GGTCGACGAC AAGCGCCTCG GGCGGCCTGC AGGCGCTGCT GCAGCTTCGC 
GACGACATCG CGCCGACATT CCAGGCCCAG CTCGACGAGA TCGCCAAGTC GCTCGTCCAG 
GCCTTCTCGG AAACCGACGG CAGCACCAGC GCGCCCGGAC TTTTCGTCTG GACCACCGCG 
TCGGGGACAT CAGGGGGAAC ACCGTCGGAT TCCGACGATA TCACCGGCAT CGCGTCGTCG 
ATCTCGGTCA ATCTTGCCGT CGTTACCAGC GAGGGCGGTG ATGCCACGAA GCTGCGCGAC 
GGAACGATCA GCGGCATCAC CGATCTCAAC AGCGCAGGAG ACAGCGGTTT CTCGGACAAT 
CTCGACGCCC TCTATACGGC GTTGACGAAA CAGCGCTCGT TCTCCTCAGA CGCCGGTCTT 
TCCACCACGC AAAGCCTGAT GGATTACGCC AGTTCCTCCA TCGGCTGGCT GGAACAATAT 
CGCAGCGATG CGACGTCGGC TTCCGAAAAC ACGACTGCCG CGCTGTCGCG CTCCGACGAG 
GCCTATTCCA ACGAAGCCGG CGTCAACCTC GACGAGGAGC TGACGCTCCT CCTCGATATC 
GAACAATCCT ACAAGGCGGC GACGAAGATC CTGAACGTCA TCGACGAGAT GTTCAAGTCG 
CTCCTCGACA TAGCGAGCTA G

Protein sequence

MSLTSGLNSV QSIFNNTGQQ SSVVSTNIAN VGNSDYVRRE ASITTSLSGA QVVSISRAQE 
TALLAQYLQS NSKDSAQQTL VTGLESLKSL MGGNDYETSP STYLSAFQQA LQTFATSPSS 
TTAAQSAVTA ARDLANSLNT ASDGVQSIRA DADAEIATQV SSLNTLLSQF ETANNAVKLA 
TATGADTSSA LDEREKLLKQ ISSIVGVTTA VRDNNDMALY TSDGTVLFET VPRTVTYVPT 
TTYVAGTEGN SVYIDGVALD AGEGSTTSAS GGLQALLQLR DDIAPTFQAQ LDEIAKSLVQ 
AFSETDGSTS APGLFVWTTA SGTSGGTPSD SDDITGIASS ISVNLAVVTS EGGDATKLRD 
GTISGITDLN SAGDSGFSDN LDALYTALTK QRSFSSDAGL STTQSLMDYA SSSIGWLEQY 
RSDATSASEN TTAALSRSDE AYSNEAGVNL DEELTLLLDI EQSYKAATKI LNVIDEMFKS 
LLDIAS