Gene ECH74115_1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1001
Symbol
ID	6972313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1016784
End bp	1018469
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	51%
IMG OID	643385016
Product	hypothetical protein
Protein accession	YP_002269516
Protein GI	209399356
COG category	[R] General function prediction only
COG ID	[COG2985] Predicted permease
TIGRFAM ID	[TIGR01625] AspT/YidE/YbjL antiporter duplication domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.588292
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.272604
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATATAA ACGTCGCCGA ATTGTTAAAT GGGAATTACA TTCTGTTATT ATTTGTGGTC 
CTCGCGCTTG GGCTATGTCT CGGAAAGTTA CGACTTGGTT CGATCCAACT GGGTAATTCC 
ATTGGCGTTT TAGTCGTATC GCTGTTATTA GGCCAACAAC ATTTCAGCAT TAACACCGAT 
GCGCTTAATC TTGGCTTTAT GCTGTTTATT TTCTGCGTCG GGGTCGAAGC CGGACCGAAC 
TTTTTTTCCA TTTTTTTTCG CGATGGGAAA AATTACCTAA TGTTAGCACT GGTGATGGTT 
GGCAGTGCGC TGGTGATCGC CTTAGGGTTA GGTAAGCTGT TTGGCTGGGA TATTGGCCTG 
ACGGCCGGTA TGTTAGCAGG CTCTATGACG TCGACACCGG TTCTGGTCGG TGCTGGCGAT 
ACACTGCGTC ATTCCGGTAT GGAAAGCAGG CAGCTCTCAC TGGCACTGGA TAATCTGAGC 
CTCGGGTATG CCTTAACCTA TTTAATCGGT CTGGTGAGTT TGATTGTTGG TGCGCGTTAC 
TTGCCGAAAT TGCAGCATCA GGACTTACAG ACCAGCGCCC AGCAAATCGC CCGCGAACGT 
GGCCTGGACA CTGATGCCAA CCGTAAGGTT TATTTACCGG TGATCCGCGC CTATCGCGTC 
GGCCCGGAGC TGGTGGCCTG GACCGACGGC AAAAATCTGC GTGAACTGGG TATTTATCGA 
CAAACCGGCT GCTACATTGA ACGTATTCGA CGTAACGGGA TTCTGGCAAA TCCAGACGGT 
GATGCCGTGC TACAAATGGG CGATGAAATA GCGTTGGTAG GCTATCCCGA CGCCCATGCC 
CGACTCGATC CCAGCTTCCG TAACGGTAAA GAAGTTTTCG ATCGTGACCT TCTCGACATG 
CGTATCGTCA CTGAAGAAGT GGTCGTTAAA AACCATAACG CTGTAGGTAA ACGTCTCGCA 
CAACTGAAGT TGACCGATCA CGGTTGCTTC CTTAACCGCG TCATTCGTAG CCAGATTGAG 
ATGCCGATTG ATGACAACGT CGTGCTTAAC AAAGGTGACG TTTTACAAGT CAGCGGCGAT 
GCCCGCCGCG TAAAAACCAT CGCCGATCGC ATCGGCTTTA TCTCGATTCA CAGCCAGGTC 
ACTGACCTGC TGGCATTCTG CGCCTTCTTT GTTATTGGGC TGATGATCGG GATGATCACC 
TTCCAGTTCA GCACATTCAG TTTCGGCATG GGGAACGCTG CCGGGTTGTT ATTCGCCGGA 
ATTATGCTGG GCTTTATGCG TGCTAACCAC CCGACCTTCG GTTACATTCC GCAAGGGGCA 
TTAAGCATGG TGAAAGAGTT CGGCTTGATG GTGTTTATGG CAGGCGTTGG TCTGAGCGCC 
GGTAGCGGTA TTAATAACGG TCTGGGCGCG ATTGGCGGTC AGATGTTGAT TGCCGGATTG 
ATTGTCAGTC TTGTGCCCGT GGTTATCTGT TTCTTGTTCG GTGCTTATGT ATTGCGAATG 
AACCGCGCAC TGTTGTTCGG CGCAATGATG GGCGCACGCA CCTGCGCGCC GGCAATGGAG 
ATCATCAGTG ATACAGCTCG CAGTAACATC CCGGCGCTGG GCTATGCGGG CACCTACGCA 
ATCGCCAACG TCCTGCTGAC GCTGGCAGGG ACAATCATCG TCATGGTATG GCCAGGATTA 
GGATAA

Protein sequence

MNINVAELLN GNYILLLFVV LALGLCLGKL RLGSIQLGNS IGVLVVSLLL GQQHFSINTD 
ALNLGFMLFI FCVGVEAGPN FFSIFFRDGK NYLMLALVMV GSALVIALGL GKLFGWDIGL 
TAGMLAGSMT STPVLVGAGD TLRHSGMESR QLSLALDNLS LGYALTYLIG LVSLIVGARY 
LPKLQHQDLQ TSAQQIARER GLDTDANRKV YLPVIRAYRV GPELVAWTDG KNLRELGIYR 
QTGCYIERIR RNGILANPDG DAVLQMGDEI ALVGYPDAHA RLDPSFRNGK EVFDRDLLDM 
RIVTEEVVVK NHNAVGKRLA QLKLTDHGCF LNRVIRSQIE MPIDDNVVLN KGDVLQVSGD 
ARRVKTIADR IGFISIHSQV TDLLAFCAFF VIGLMIGMIT FQFSTFSFGM GNAAGLLFAG 
IMLGFMRANH PTFGYIPQGA LSMVKEFGLM VFMAGVGLSA GSGINNGLGA IGGQMLIAGL 
IVSLVPVVIC FLFGAYVLRM NRALLFGAMM GARTCAPAME IISDTARSNI PALGYAGTYA 
IANVLLTLAG TIIVMVWPGL G