Gene ECH74115_1459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1459
Symbol	flgI
ID	6969444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1438967
End bp	1440064
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	54%
IMG OID	643385432
Product	flagellar basal body P-ring protein
Protein accession	YP_002269926
Protein GI	209398849
COG category	[N] Cell motility
COG ID	[COG1706] Flagellar basal-body P-ring protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.31008
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.000149159
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGATTAAAT TTCTCTCTGC ATTAATTCTT CTACTGGTTA CGACGGCGGC TCAGGCTGAG 
CGTATTCGCG ATCTCACCAG TGTTCAGGGG GTAAGGCAAA ACTCACTGAT TGGCTATGGT 
CTGGTGGTGG GGCTGGATGG CACCGGTGAC CAGACAACCC AGACGCCGTT TACCACACAA 
ACGCTTAATA ACATGCTCTC ACAGCTGGGA ATTACCGTTC CGACGGGCAC CAATATGCAG 
CTAAAAAACG TTGCTGCGGT AATGGTGACG GCGTCACTTC CACCGTTTGG ACGTCAGGGG 
CAAACCATTG ACGTGGTGGT TTCTTCCATG GGAAATGCCA AAAGCCTGCG TGGCGGCACA 
TTGTTGATGA CTCCGCTTAA GGGCGTTGAC AGTCAGGTGT ATGCGCTGGC GCAGGGCAAT 
ATTCTGGTTG GCGGCGCAGG AGCCTCCGCT GGCGGTAGCA GTGTTCAGGT GAACCAACTG 
AACGGTGGAC GGATCACCAA TGGTGCAGTT ATTGAACGTG AATTACCCAG CCAGTTTGGC 
GTCGGGAATA CCCTTAATTT GCAACTTAAC GACGAAGATT TCAGCATGGC GCAGCAAATC 
GCTGACACCA TCAACCGCGT GCGTGGATAT GGCAGCGCCA CCGCGTTGGA TGCGCGGACT 
ATTCAGGTGC GCGTACCGAG TGGCAACAGT TCCCAGGTCC GTTTCCTTGC CGATATCCAG 
AATATGCAGG TTAATGTCAC CCCGCAGGAC GCTAAAGTAG TGATTAACTC GCGCACCGGT 
TCGGTGGTGA TGAATCGCGA AGTGACTCTC GACAGCTGCG CGATAGCGCA GGGAAATCTC 
TCAGTAACAG TCAATCGTCA GGCCAATGTC AGCCAACCAG ATACACCGTT TGGTGGCGGA 
CAGACCGTGG TAACGCCACA AACGCAGATC GACTTACGCC AGAGCGGCGG TTCGCTGCAA 
AGCGTACGTT CCAGCGCCAG CCTCAATAAC GTGGTGCGCG CGCTCAATGC GCTGGGCGCT 
ACGCCGATGG ATCTGATGTC TATTTTGCAA TCAATGCAAA GTGCGGGATG TCTGCGGGCA 
AAACTGGAAA TCATCTGA

Protein sequence

MIKFLSALIL LLVTTAAQAE RIRDLTSVQG VRQNSLIGYG LVVGLDGTGD QTTQTPFTTQ 
TLNNMLSQLG ITVPTGTNMQ LKNVAAVMVT ASLPPFGRQG QTIDVVVSSM GNAKSLRGGT 
LLMTPLKGVD SQVYALAQGN ILVGGAGASA GGSSVQVNQL NGGRITNGAV IERELPSQFG 
VGNTLNLQLN DEDFSMAQQI ADTINRVRGY GSATALDART IQVRVPSGNS SQVRFLADIQ 
NMQVNVTPQD AKVVINSRTG SVVMNREVTL DSCAIAQGNL SVTVNRQANV SQPDTPFGGG 
QTVVTPQTQI DLRQSGGSLQ SVRSSASLNN VVRALNALGA TPMDLMSILQ SMQSAGCLRA 
KLEII