Gene Msil_0043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0043
Symbol	flgK
ID	7092371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	39857
End bp	41347
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	60%
IMG OID	643463376
Product	flagellar hook-associated protein FlgK
Protein accession	YP_002360388
Protein GI	217976241
COG category	[N] Cell motility
COG ID	[COG1256] Flagellar hook-associated protein
TIGRFAM ID	[TIGR02492] flagellar hook-associated protein FlgK

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGG CGAATGCGGC GGCGATCGCG CAGTCGGGGT TAGCTTCGGT TACGACCGAG 
ATCGCAACAT TGTCGCGTAA CATTTCCGGC GCTAACGACA CCTCGGTTTA TTCGCGCAAG 
ATCGCCAATG TCGTATCGAC CGCCTCTGGC TCGCAGGTCA CCTCGATCAG CCGCGCCTCG 
AGTCAGGCGG TGTTCGAGAA TGTGCTTAAT GCGACCTCTG CCATTGCCGC TGAAGACGCT 
GTATCGACAG GTCTTGAAGC GCTGGCGACG ACAGTTGGAG ATGTCGCCAG CGCCGCAGGC 
GCGGACGCAA CCTCGACGGC GACGTCGCCA GCAGCCTTGA TCAGCCGATT GTCCGATGCG 
CTGCAATATT ATTCCGGGTC GCCGAGCGAC ATGACGGCTG CGGCGAATGT CGTCTCCGCG 
GCCAATGCTT TGGCAAGGGG GCTCAATCAG GGCTCGGCCG CCATTCAGCA GGCGCGCGCG 
ACCGCCGACT CCGACATTGC GGCCGCCGTG TCGGATATAA ATTCACAGCT CGCCCAGTTC 
CAAGAAGTCA ACGAAAAAAT CATCGCGGCT ACGGCCGTGG GCAAAGACAG CACGGATTTA 
CAGGATCAGC GCGATACGAT CCTGAAGCAG ATTTCCGCGA ATATCGGCAT ATCGACCGTC 
ACCGCGGGAA ATGGCGATAT GTCCCTCTAT ACCGACAGCG GCGTTACGCT TTTTCAGGGG 
GGCCGCGCGC GGACAGTCAG CTTCACGCCG ACAACCACTT ATGTGACGGC GACGGTGGGA 
CAGGCTGTTT ATGTCGACGG CGTGGCGATT ACGGGCGCTA CGGCTACCAT GGCGATTGCC 
TCGGGCAAGA TCGCTGGCCT GGCGACAATC CGGGACGCCG TTGCAGTCAC CTATCAGGCG 
CAGCTCGATG GCGTCGCAAG CGCTTTGATC ACCGCTTTTC GGGAAAGCGA TCAGGCAGCG 
GTCGGCCCCG ATTTGCCTGG GCTCTTTACA ACGGCGAGCG CAACAGCAAT TCCATCTTCG 
GCGGCCGGAT TGGCGAGCGC GATCATTGTT AACGCAGCGG TAGACCCCTC GCAAGGCGGG 
GATTTGACCC TCCTGCGCGA CGGCGGCATC GCCGATCCAT CAGGCACGGA TTACACTTAC 
AACACAAGCG GCGCCGCGAG CTTTGCGGGC CGCATCTCAG AATTGATCGA CAATCTATCC 
GCAACACAAA GCTTTTCATC GTCTGGGAGC CTGACGACGA GCGCGAGCGT TGGAGGCTAT 
GCCGCCGCGT CAGTCAGTTG GCTGGAGGCG CAACGGTCGG CCGCATCCTC GCGCAGCAGC 
TACCAAGGCG CGCTTTTGAG CACCGCCTCG ACAGCATTGT CGAACGCGAC CGGCGTCAAT 
ATCAACGATG AGATGTCAAA AATGCTTGAT CTCGAGCAGT CCTACGCTGC CTCAGCGAAA 
TTGCTTAGCT CGATCAACGA TATGTTCAAC GCTCTCCTGT CGGGCATATA G

Protein sequence

MSLANAAAIA QSGLASVTTE IATLSRNISG ANDTSVYSRK IANVVSTASG SQVTSISRAS 
SQAVFENVLN ATSAIAAEDA VSTGLEALAT TVGDVASAAG ADATSTATSP AALISRLSDA 
LQYYSGSPSD MTAAANVVSA ANALARGLNQ GSAAIQQARA TADSDIAAAV SDINSQLAQF 
QEVNEKIIAA TAVGKDSTDL QDQRDTILKQ ISANIGISTV TAGNGDMSLY TDSGVTLFQG 
GRARTVSFTP TTTYVTATVG QAVYVDGVAI TGATATMAIA SGKIAGLATI RDAVAVTYQA 
QLDGVASALI TAFRESDQAA VGPDLPGLFT TASATAIPSS AAGLASAIIV NAAVDPSQGG 
DLTLLRDGGI ADPSGTDYTY NTSGAASFAG RISELIDNLS ATQSFSSSGS LTTSASVGGY 
AAASVSWLEA QRSAASSRSS YQGALLSTAS TALSNATGVN INDEMSKMLD LEQSYAASAK 
LLSSINDMFN ALLSGI