Gene ECH74115_2758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2758
Symbol
ID	6970895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2578572
End bp	2579891
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	60%
IMG OID	643386613
Product	tail fiber protein
Protein accession	YP_002271092
Protein GI	209400529
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3064] Membrane protein involved in colicin uptake
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.204827
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.264951
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATATGG CAGTAAAGAT TTCAGGTGTA CTGAAAGACG GCACAGGAAA ACCGGTAGAG 
AACTGCACCA TTCAACTGAA AGCCAGACGG ACCAGCAGCA CGGTGGTGGT GAACACGGTG 
GCCTCTGAAA ATCCGGATGA AGCCGGTCGT TACAGCATGG ACGTTGAGTA CGGTCAGTAC 
AGCGTCATTC TGTTGGTGGA GGGCTTCCCG CCGTCACATG CCGGGACCAT CACCGTGTAT 
GAAGATTCTC AACCGGGGAC GCTGAATGAT TTTCTCGGTG CCATGTCGGA GGATGACGTC 
CGGCCGGAGG CACTGCGTCG TTTTGAACTG ATGGTGGAAG AAGCGGCGCG TCACGCTGAG 
GAGGCGAAGA AGAATGCCGG AGAGGCGGAG ACATCAGCGA GGAATGCCGG CATATCATCC 
AGTAAGGCGG AAGCGAGCGC GGCAAATGCT GACACTTCAG CAGGGGATGC ATTGGAGTCA 
GCCCGGCAGG CGGCAGAAAG TGCAGCCGCT GCAAAGCAGT CAGAGGATGC GTCCTCGTCC 
TCGGCTTCTG CGGCCGCTCA AAAAGCCAGT GAGTCATCAC AAAGTGCAGC AGAAGCTGAA 
TTGTCAAGAA AGACGGCAGA AAGTGCAGCC GGTAATGCAG CCAGGGATGC AACGACCGCA 
ACAGAAAAAG CCCGGGAGTC AGCAGAAAGC GCACAGTCAG CGGAACAAAG CAGGATAGCG 
GCGGAAGAGG CCGTAAACCG AATCCCCACC GTGGTGGGAC CTCCCGGGCC AAAGGGGGAA 
CAGGGGCCCG CGGGTCCTCA GGGGCCGAAG GGTGATAAGG GAGAGCGCGG TGACACCGGC 
CCTGTCGGGG CAACCGGCGA ACGGGGACCG GCAGGTGATG CTGGTCCGGC AGGCCCGCAG 
GGGCCGAAAG GTGACAGGGG AGAGCGGGGA GAGACCGGTC TGACGGGAAA TGCAGGTCCA 
CAGGGTCCAA AGGGAGATAC CGGTGCGGCA GGCCCGGCAG GCCCACAGGG ACCGAAAGGA 
GAAACAGGTG CGGCTGGCCC GGTGGGGGCA ACCGGACCTC AGGGGCCGAA GGGCGACCCG 
GGGGAGACGC AAATACGGTT CCGTCTGGGG CCGGGAAACA TTATTGAGAC AAACAGCAAT 
GGCTGGTTCC CGGATACAGA TGGTGCGCTC ATCACCGGAC TGACCTTTCT TGCCCCCAAA 
GATACCACAC GGGTTCAGGG TTTTTTTCAG CATTTGCAGG TCAGGTTTGG TGACGGGCCG 
TGGCAGGATG TTAAGGGGCT GGATGAAGTG GGCAGTGATA CAGGCAGAAC AGGAGAATGA

Protein sequence

MNMAVKISGV LKDGTGKPVE NCTIQLKARR TSSTVVVNTV ASENPDEAGR YSMDVEYGQY 
SVILLVEGFP PSHAGTITVY EDSQPGTLND FLGAMSEDDV RPEALRRFEL MVEEAARHAE 
EAKKNAGEAE TSARNAGISS SKAEASAANA DTSAGDALES ARQAAESAAA AKQSEDASSS 
SASAAAQKAS ESSQSAAEAE LSRKTAESAA GNAARDATTA TEKARESAES AQSAEQSRIA 
AEEAVNRIPT VVGPPGPKGE QGPAGPQGPK GDKGERGDTG PVGATGERGP AGDAGPAGPQ 
GPKGDRGERG ETGLTGNAGP QGPKGDTGAA GPAGPQGPKG ETGAAGPVGA TGPQGPKGDP 
GETQIRFRLG PGNIIETNSN GWFPDTDGAL ITGLTFLAPK DTTRVQGFFQ HLQVRFGDGP 
WQDVKGLDEV GSDTGRTGE