Gene ECH74115_4887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4887
Symbol
ID	6971693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4521505
End bp	4523565
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	53%
IMG OID	643388575
Product	AsmA family protein
Protein accession	YP_002273003
Protein GI	209398465
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2982] Uncharacterized protein involved in outer membrane biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.647897
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGG CAGGCAAAAT AACCGCTGCG ATTTCAGGGG CTTTCTTGTT GTTGATTGTC 
GTGGCGATCA TTTTGATTGC AACTTTTGAC TGGAATCGAC TCAAACCGAC CATCAACCAG 
AAAGTCTCTG CGGAGTTGAA TCGTCCGTTC GCTATCCGTG GCGATCTGGG CGTGGTGTGG 
GAGCGGCAAA AGCAAGAAAC TGGCTGGCGC AGCTGGGTGC CGTGGCCCCA TGTACACGCG 
GAAGACATCA TTCTTGGCAA TCCACCGGAT ATTCCCGAAG TCACGATGGT GCATTTGCCA 
CGCGTAGAAG CAACGCTGGC CCCGCTGGCG CTGCTGACCA AAACGGTCTG GCTGCCGTGG 
ATCAAGCTCG AAAAGCCCGA CGCGCGCCTG ATTCGCCTCT CTGAAAAGAA CAATAACTGG 
ACGTTTAATC TCGCCAACGA TGATAACAAA GACGCGAATG CAAAGCCGTC GGCATGGTCG 
TTTCGGCTGG ATAATATTCT TTTCGATCAA GGGCGGATCG CCATTGATGA CAAAGTAAGC 
AAAGCGGATC TGGAGATTTT TGTTGATCCC TTAGGCAAGC CGCTGCCGTT CAGCGAAGTT 
ACTGGATCGA AAGGTAAAGC GGATAAAGAA AAGGTGGGCG ATTACGTTTT TGGCCTGAAG 
GCGCAGGGAC GTTATAACGG TGAACCGCTC ACGGGTACGG GAAAAATAGG CGGTATGCTG 
GCGCTGCGTG GCGAAGGGAC GCCGTTTCCG GTACAGGCTG ATTTCCGTTC AGGTAATACC 
CGTGTTGCTT TTGATGGCGT CGTGAATGAC CCAATGAAGA TGGGCGGTGT CGATTTACGG 
CTTAAATTTT CTGGCGATTC ACTGGGTGAT CTCTATGAAC TGACGGGCGT TCTGCTGCCC 
GATACCCCGC CGTTTGAAAC GGATGGTCGG CTGGTAGCGA AAATCGACAC TGAAAAATCG 
TCGGTCTTTG ATTATCGCGG CTTTAATGGG CGAATTGGCG ATAGCGATAT CCACGGTTCT 
CTGGTCTACA CCACCGGCAA GCCACGACCA AAACTGGAAG GTGATGTCGA GTCGCGGCAA 
TTGCGGCTGG CGGACCTGGG ACCGTTGATT GGCGTTGATT CCGGGAAAGG GGCAGAAAAG 
TCGAAACGGT CTGAACAGAA GAAGGGCGAA AAAAGCGTTC AGCCTGCGGG CAAAGTGCTG 
CCTTATGACC GCTTCGAAAC CGATAAATGG GACGTTATGG ATGCCGATGT TCGCTTCAAA 
GGGCGGCGCA TTGAGCATGG CAGTAGCCTG CCGATTAGCG ATCTTTCTAC TCATATCATC 
CTCAAAAATG CTGACTTGCG CCTGCAACCG CTGAAATTTG GCATTGCGGG TGGCAGCATT 
GCGGCGAATA TTCATCTGGA AGGCGATAAA AAGCCGATGC AGGGGCGGGC AGATATTCAG 
GCTCGTCGAC TGAAACTGAA AGAACTGATG CCCGATGTGG AACTGATGCA GAAGACGCTG 
GGGGAAATGA ACGGTGACGC GGAACTGCGC GGTAGCGGTA ACTCGGTGGC GGCACTTTTA 
GGCAACAGTA ACGGCAACCT GAAACTGTTG ATGAATGACG GGCTGGTGAG CCGCAACCTG 
ATGGAGATTG TTGGGCTGAA TGTCGGCAAC TACATTGTCG GTGCGATATT TGGTGACGAT 
GAGGTGCGGG TGAACTGCGC GGCGGCGAAT CTGAATATTG CCAACGGCGT GGCACGCCCG 
CAGATTTTTG CTTTCGATAC TGAGAACGCG TTGATTAACG TTACCGGCAC GGCAAGTTTT 
GCTTCGGAAC AGCTGGATTT GACTATTGAT CCGGAGAGTA AAGGTATTCG GATTATCACA 
CTGCGTTCGC CGCTGTATGT GCGTGGGACG TTTAAAAATC CTCAGGCTGG GGTGAAAGCC 
GGGCCGTTGA TTGCCCGTGG TGCTGTTGCT GCGGCACTGG CAACGCTGGT TACGCCAGCG 
GCAGCGTTGC TGGCACTGAT CTCACCTTCC GAAGGGGAGG CTAATCAGTG CCGGACGATT 
TTGTCGCAGA TGAAGAAGTG A

Protein sequence

MSKAGKITAA ISGAFLLLIV VAIILIATFD WNRLKPTINQ KVSAELNRPF AIRGDLGVVW 
ERQKQETGWR SWVPWPHVHA EDIILGNPPD IPEVTMVHLP RVEATLAPLA LLTKTVWLPW 
IKLEKPDARL IRLSEKNNNW TFNLANDDNK DANAKPSAWS FRLDNILFDQ GRIAIDDKVS 
KADLEIFVDP LGKPLPFSEV TGSKGKADKE KVGDYVFGLK AQGRYNGEPL TGTGKIGGML 
ALRGEGTPFP VQADFRSGNT RVAFDGVVND PMKMGGVDLR LKFSGDSLGD LYELTGVLLP 
DTPPFETDGR LVAKIDTEKS SVFDYRGFNG RIGDSDIHGS LVYTTGKPRP KLEGDVESRQ 
LRLADLGPLI GVDSGKGAEK SKRSEQKKGE KSVQPAGKVL PYDRFETDKW DVMDADVRFK 
GRRIEHGSSL PISDLSTHII LKNADLRLQP LKFGIAGGSI AANIHLEGDK KPMQGRADIQ 
ARRLKLKELM PDVELMQKTL GEMNGDAELR GSGNSVAALL GNSNGNLKLL MNDGLVSRNL 
MEIVGLNVGN YIVGAIFGDD EVRVNCAAAN LNIANGVARP QIFAFDTENA LINVTGTASF 
ASEQLDLTID PESKGIRIIT LRSPLYVRGT FKNPQAGVKA GPLIARGAVA AALATLVTPA 
AALLALISPS EGEANQCRTI LSQMKK