Gene ECH74115_3736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3736
Symbol
ID	6970827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3457732
End bp	3458910
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	53%
IMG OID	643387529
Product	outer membrane protein assembly complex subunit YfgL
Protein accession	YP_002271982
Protein GI	209398578
COG category	[S] Function unknown
COG ID	[COG1520] FOG: WD40-like repeat
TIGRFAM ID	[TIGR03300] outer membrane assembly lipoprotein YfgL

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.550553
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATTGC GTAAATTACT GCTGCCAGGA CTGCTTTCCG TTACCCTTTT AAGCGGCTGT 
TCGCTGTTTA ACAGCGAAGA AGATGTGGTA AAGATGTCCC CATTGCCAAC CGTTGAAAAC 
CAGTTTACGC CGACCACGGC GTGGAGCACT TCCGTTGGTA GCGGCATTGG CAACTTCTAT 
TCCAATCTTC ATCCGGCACT GGCGGACAAC GTTGTCTATG CAGCGGACCG CGCTGGTTTA 
GTAAAAGCGC TGAATGCGGA TGATGGCAAA GAAATCTGGT CTGTCAGCCT GGCCGAGAAA 
GATGGCTGGT TCTCTAAAGA GCCTGCATTA CTTTCTGGCG GTGTGACCGT GTCTGGTGGA 
CATGTCTACA TTGGCAGCGA AAAGGCGCAG GTTTACGCGC TGAATACCAG CGATGGTACT 
GTGGCATGGC AAACTAAAGT CGCGGGTGAA GCACTTTCGC GCCCGGTGGT CAGCGACGGT 
CTGGTGTTAA TCCACACCAG TAACGGTCAG TTACAAGCGC TGAACGAAGC TGACGGCGCT 
GTCAAATGGA CAGTTAACCT CGATATGCCT TCGCTCTCTT TGCGTGGCGA GTCTGCGCCG 
GCAACGGCTT TTGGTGCGGC CGTCGTGGGG GGCGATAATG GTCGCGTCAG CGCAGTGCTG 
ATGGAACAGG GCCAGATGAT TTGGCAGCAG CGTATTTCCC AAGCGACCGG TTCTACCGAA 
ATTGACCGTC TGAGCGATGT TGACACGACT CCCGCCGTTG TTAACGGCGT TGTTTTCGCG 
CTGGCCTATA ATGGTAACCT GACGGCGCTT GATCTGCGCA GTGGTCAGAT TATGTGGAAA 
CGCGAACTGG GTTCGGTGAA TGATTTCATC GTCGACGGCA ATCGCATCTA TCTGGTCGAT 
CAAAATGACC GGGTGATGGC GTTGACCATT GATGGCGGCG TTACGCTGTG GACACAAAGC 
GATCTGCTGC ATCGCCTGCT GACTTCTCCG GTGCTGTATA ATGGCAACCT GGTGGTCGGT 
GACAGTGAAG GTTATTTGCA CTGGATTAAC GTCGAAGATG GTCGTTTCGT TGCCCAGCAA 
AAAGTTGATA GTTCCGGTTT CCAGACTGAA CCGGTTGCCG CTGACGGCAA ACTGCTGATC 
CAGGCAAAAG ACGGAACCGT GTACTCTATT ACACGTTAA

Protein sequence

MQLRKLLLPG LLSVTLLSGC SLFNSEEDVV KMSPLPTVEN QFTPTTAWST SVGSGIGNFY 
SNLHPALADN VVYAADRAGL VKALNADDGK EIWSVSLAEK DGWFSKEPAL LSGGVTVSGG 
HVYIGSEKAQ VYALNTSDGT VAWQTKVAGE ALSRPVVSDG LVLIHTSNGQ LQALNEADGA 
VKWTVNLDMP SLSLRGESAP ATAFGAAVVG GDNGRVSAVL MEQGQMIWQQ RISQATGSTE 
IDRLSDVDTT PAVVNGVVFA LAYNGNLTAL DLRSGQIMWK RELGSVNDFI VDGNRIYLVD 
QNDRVMALTI DGGVTLWTQS DLLHRLLTSP VLYNGNLVVG DSEGYLHWIN VEDGRFVAQQ 
KVDSSGFQTE PVAADGKLLI QAKDGTVYSI TR