Gene ECH74115_0328 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0328
Symbol
ID	6967763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	332686
End bp	333879
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	57%
IMG OID	643384389
Product	purine ribonucleoside efflux pump NepI
Protein accession	YP_002268904
Protein GI	209400131
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.389752
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACAC TAAGCCAAAC ACCATCACCT CATCATCAGC ACGCATACTG GGGCGGTATT 
TTTGCCATGA CCCTGTGCGT GTTTGTGCTG ATTGCTTCTG AATTTATGCC CGTCAGCCTG 
CTCACGCCGA TTGCCCGTGA CCTGGGCGTG ACGGAGGGGC TGGCAGGGCG GGGGATTGCT 
ATCTCCGGTG CGCTGGCGGT TCTGACCAGC CTGACGCTTT CAACGCTAGC TGGAAAGATG 
AATCGTAAGT TCCTGCTGCT GGGGATGACG GTTCTGATGG CCGTATCGGG GCTTATTATT 
GCGCTGGCTA CCAGTTATCT GATGTATATG GTCGGTCGTG CGATGATTGG TGTGGCCATT 
GGCGGATTCT GGTCGATGTC AGCGGCAACG GCGATTCGTC TGGTGCCGCA GCATCAGGTC 
ACGCGTGCGC TGGCGATTTT CAACGCCGGT AATGCGCTGG CGACGGTCGT GGCCGCGCCG 
CTGGGAAGCT ATCTGGGGGC TACGGTCGGA TGGCGAGGCG CTTTCTTGTG CTTGGTGCCC 
ATGGCGGTTG TCGCCTTTAT CTGGCAGTGC ATTAGTCTGC CCAGCATGGA TGCGAATAAA 
AGCCACACGT CATGTGGCGC GGTATTCCGC TTATTTAGCC GCCGCATGGT TGTGGTCGGC 
ATGATAGCTT GTGGCCTGTT TTTCATGGGG CAGTTTGCGC TATTCACCTA TGTGCGCCCA 
TTTCTGGAGT CGGTGACACG GGTTAATTCC TTAGGCTTGT CGTTGATTTT GCTGATTATC 
GGCGTGGCCG GTTTTATTGG CACGCTGGTT GTTTCGATAT TTCTCAACAG AAAATTCTAC 
CCCACGCTGA TGGCCATACC CGGACTGATG GCCGTCATTG CCATCGGTCT GATGCTTACC 
GGGCATCACG TCTGGATGGT CTCGCTGCTG TTAGGACTCT GGGGCATGCT GGCCACCGCC 
GCGCCAACCG GATGGTGGAC ATGGATTGCG CGTACGTTGC CTGACAACGC CGAAGCCGGA 
GGCGGGCTCA TGGTCGCGGT GATTCAGCTC TCAATCGCCC TTGGATCAAC GGCAGGAGGC 
ATCGTGTTTG ACCGCCTTGG CTGGCAGAGT ACGTTTGCCA TGAGTAGTGT GCTGCTCCTT 
TGCGCGGGCG TACTGACCTT TGTTACAGCA CGCCAGAAGG CCGGTGCGCT TTAG

Protein sequence

MSTLSQTPSP HHQHAYWGGI FAMTLCVFVL IASEFMPVSL LTPIARDLGV TEGLAGRGIA 
ISGALAVLTS LTLSTLAGKM NRKFLLLGMT VLMAVSGLII ALATSYLMYM VGRAMIGVAI 
GGFWSMSAAT AIRLVPQHQV TRALAIFNAG NALATVVAAP LGSYLGATVG WRGAFLCLVP 
MAVVAFIWQC ISLPSMDANK SHTSCGAVFR LFSRRMVVVG MIACGLFFMG QFALFTYVRP 
FLESVTRVNS LGLSLILLII GVAGFIGTLV VSIFLNRKFY PTLMAIPGLM AVIAIGLMLT 
GHHVWMVSLL LGLWGMLATA APTGWWTWIA RTLPDNAEAG GGLMVAVIQL SIALGSTAGG 
IVFDRLGWQS TFAMSSVLLL CAGVLTFVTA RQKAGAL