Gene EcSMS35_0272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0272
Symbol	lfgK
ID	6143853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	282527
End bp	283903
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	58%
IMG OID	641615170
Product	lateral flagellar hook associated protein 1
Protein accession	YP_001742379
Protein GI	170680262
COG category	[N] Cell motility
COG ID	[COG1256] Flagellar hook-associated protein
TIGRFAM ID	[TIGR02492] flagellar hook-associated protein FlgK

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.508781
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATGA TTAACATCGG CTACAGCGGC GCATCAACCG CGCAGGTAGA GCTGAACGTC 
ACGGCGCAAA ACACCGCCAA CGCCATGACC ACGGGCTACA CCCGTCAGGT GGCGGAGATC 
AGCACCATCG GCGCCAGCGG TGGTTCGCCG AACAGCGCCG GTAACGGCGT GCAGGTCGAC 
AGCATTCGCC GCGTCTCTAA CCAGTATCAG GTGAATCAGG TGTGGTATGC CGCCAGCGAT 
TACGGCTATT ACAGCACCCA GCAGGGGTAT CTCACGCAAC TGGAAGCGGT ACTGAGCGAC 
GATAACAGCA GCCTGAGCGG CGGCTTCGAT AACTTCTTCG CCGCCCTCAA CGAAGCGACC 
ACCAGCCCCG ATGATTCCGC CCTGCGCGAA CAGGTGATCA GCGAAGCCGG GGCGCTGTCG 
TTGCGTATCG ACAACACGCT GGATTACATC GACTCGCAAA GCACGGAAAT CATCAGCCAG 
CAGCAGGCAA TGGTGTCGCA AATCAACACG CTTACCAGCG GCATCGCCAG CTATAACCAG 
CAAATCGCCC AGGCCGAAGC CAACGGCGAT AACGCCTCCG CGCTGTACGA CGCCCGCGAT 
CAGATGGTGG AAGAACTGAG CGGGATGATG GATGTGCAGG TCAATATCGA CGACCAGGGC 
AACTACAACG TCACCCTGAA AAACGGTCAA CCGCTGGTGA GCGGGCAGCA AAGCTCGACC 
ATCGCGCTGG AAACCAACGC CGATGGCACG CCGACCATGT CGCTGACTTT CGCTGGCACC 
ACCTCGACGA TGACTACCGA CACCGGCGGT TCATTAGGCG CACTGTTTGA TTATCAAAAC 
GACGTGCTGA CGCCGCTGAC CGACACCATC AACAGCATGG CGTTGCAGTT TGCCGATGCG 
GTCAACAACC AGCTGGCGCA GGGCTACGAT CTCAACGGTA ACCCCGGCGA GCCGCTGTTT 
ATTTATGACG CCAGCAACGC CGATGGCCCG CTGACCGTTA ACCCGGATAT CACCGCCGAT 
GAGCTGGCGT TCTCCAGTTC GCCGGATGAA AGCGGTAACA GCGACAACCT TCAGGCGCTG 
ATCAACATCT CCACCGAACC GCTGGAGATA GCCAACCTTG GCAGCGTGAC GGTCGGGCAG 
GCGTGCTCGT CGATCATCAG CAACATCGGC ATTTACAGCC AGCAAAACCA GACGGAAGTC 
GATGCCGCGT CCAATGTTTA TTCTGAGGCG CAAAACCAGC AGAGCAGCGT CAGCGGCGTC 
AGCATGGACG AAGAAGCGGT GAACCTGATC ACCTATCAAC AAATTTATGA AGCTAATCTG 
AAAGTCATTT CCGCCGGGGC CGAGATTTTC GATTCGGTGC TGGAAATGTG CAGCTAA

Protein sequence

MDMINIGYSG ASTAQVELNV TAQNTANAMT TGYTRQVAEI STIGASGGSP NSAGNGVQVD 
SIRRVSNQYQ VNQVWYAASD YGYYSTQQGY LTQLEAVLSD DNSSLSGGFD NFFAALNEAT 
TSPDDSALRE QVISEAGALS LRIDNTLDYI DSQSTEIISQ QQAMVSQINT LTSGIASYNQ 
QIAQAEANGD NASALYDARD QMVEELSGMM DVQVNIDDQG NYNVTLKNGQ PLVSGQQSST 
IALETNADGT PTMSLTFAGT TSTMTTDTGG SLGALFDYQN DVLTPLTDTI NSMALQFADA 
VNNQLAQGYD LNGNPGEPLF IYDASNADGP LTVNPDITAD ELAFSSSPDE SGNSDNLQAL 
INISTEPLEI ANLGSVTVGQ ACSSIISNIG IYSQQNQTEV DAASNVYSEA QNQQSSVSGV 
SMDEEAVNLI TYQQIYEANL KVISAGAEIF DSVLEMCS