Gene EcSMS35_0266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0266
Symbol	lfgE
ID	6144018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	277141
End bp	278343
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	57%
IMG OID	641615164
Product	lateral flagellar hook protein LfgE
Protein accession	YP_001742373
Protein GI	170681389
COG category	[N] Cell motility
COG ID	[COG1749] Flagellar hook protein FlgE
TIGRFAM ID	[TIGR03506] fagellar hook-basal body proteins

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTATG AAATTGCCGC AACGGGGCTG AATGCCGTTA ACGAACAGCT GGACGGGATC 
AGTAACAACA TCGCCAACGC CGGAACGGTA GGCTATAAGT CGATGACCAC CCAGTTTTCA 
GCCATGTATG CCGGAAGTCA GGCGATGGGC GTCAGCGTGG CAGGCACCGC GCAAAGTATT 
TCGCGCGGCG GTTCGCTGGT ATCCACCGGT AACGCGCTGG ATCTGGCGAT TAACGACGAC 
GGTTTTTTTG TTACCTGCGA CAGCGCGGGC AACATTTCTT ATACCCGCGC CGGATCGTTT 
GAAACCGACA AAAACGGCTA TATCGTCAAC GCCTCAGGCG CTTATTTGCA GGGCTATCCG 
GTCGATGACA CGGGCACTCT GCAAACCGGT ACAGTCACCG ATATCCAGAT CAAAACTGGC 
AATATTCCGG CGCAGGCCAG CAGCAGCCTG ACCTTTACCG CCAACTTCGA TGCCAGCGAC 
GACGCTATCG ACCGCACTAC CGTACCGTTC GACGCGACCA ACAGCAGCTC GTATACCGAC 
AGCTACACCA CCACGGTGTA CGACTCATTA GGTAACGAAC ACTCGGTATG CCAGTACTTC 
ACCAAAACCA GCGACAACAC CTGGGAAGTG CAGTACACCT TCGACGGTCA GCAGCAGACC 
GGCGTTCCGG CGACGACGTT AACCTTCGAC CCGAACACCG GGAAGCTGAC TTCGCCAACC 
ACGCCGCAGA CCATTGAGTT TCAGACCGAC GCCGCCGCAC CCATCGACTT AACCGTCGAT 
TACTCCACCT GTACGCAATA CGGCTCTGAA TTTTCGGTCA CCACCAACGC CGCCAACGGC 
TACGCCTCCG CTACGCAAAA CGGTGTGCAG GTCGATGACG ATGGCAAAGT TTACGCTACC 
TACAGCAACG GCGAGCGCAT GTTGCAGGGC CAGGTGGTGC TGGCGACTTT CCCGAATGAA 
AACGGACTCG AAGCGGTGAG CGGCACCGCG TGGGTACAAA CTGGGGAATC CGGCACGCCG 
CTGATTGGCG TTCCCGGCTC CGGTTCCTGC GGCACGCTGT CGTCGGGCGT GCTCGAAAGC 
TCTAACGTCG ATATCACCAG CGAGTTAGTC AACCTGATGA CCGCCCAGCG TAACTATCAG 
GCCAACACCA AAGTGATCGC CACCAGCACG CAGCTCGATG ACGCGCTGTT CCAGGCAATG 
TAA

Protein sequence

MSYEIAATGL NAVNEQLDGI SNNIANAGTV GYKSMTTQFS AMYAGSQAMG VSVAGTAQSI 
SRGGSLVSTG NALDLAINDD GFFVTCDSAG NISYTRAGSF ETDKNGYIVN ASGAYLQGYP 
VDDTGTLQTG TVTDIQIKTG NIPAQASSSL TFTANFDASD DAIDRTTVPF DATNSSSYTD 
SYTTTVYDSL GNEHSVCQYF TKTSDNTWEV QYTFDGQQQT GVPATTLTFD PNTGKLTSPT 
TPQTIEFQTD AAAPIDLTVD YSTCTQYGSE FSVTTNAANG YASATQNGVQ VDDDGKVYAT 
YSNGERMLQG QVVLATFPNE NGLEAVSGTA WVQTGESGTP LIGVPGSGSC GTLSSGVLES 
SNVDITSELV NLMTAQRNYQ ANTKVIATST QLDDALFQAM