Gene ECH74115_3255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3255
Symbol
ID	6969045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2987635
End bp	2988792
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	57%
IMG OID	643387068
Product	ABC transporter, quaternary amine uptake (QAT) family, permease protein
Protein accession	YP_002271532
Protein GI	209397432
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1174] ABC-type proline/glycine betaine transport systems, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.000687244
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACTTATC TACGTATTAA TCCTGTTCTG GCGCTGCTGC TGTTGCTGAC GGCAATCGCA 
GCAGCGCTGC CGTTTATCAG CTACGCGCCT AATCGTTTAG TCTCGGGTGA AGGGCGTCAT 
CTCTGGCAAC TGTGGCCGCA AACGATCTGG ATGCTGGTGG GCGTTGGTTG CGCCTGGCTG 
ACAGCCTGTT TTATTCCCGC TAAAAAAGGC AGCATTTTTG CACTCATTCT GGCGCAATTC 
GTCTTCGTAT TGCTGGTGTG GGGAGCTGGA AAGGCGGCGA CCCAACTGGC GCAAAATGGC 
AGTGCGCTGG CGCGTACCAG CCTCGGCAGT GGTTTCTGGT TGGCTTCGGC GCTGGCATTG 
CTGGCCTGTA GCGATGCCAT CCGCCGAATC TCCACGCATC CGCTGTGGCG CTGGTTGTTG 
CATATGCAGA TTGCCATTAT TCCGCTGTGG TTGCTGTACT CCGGCACGCT TAACGATCTC 
TCACTAATGA AAGAATACGC CAACCGTCAG GATGTGTTTG ACGACGCGCT GGCACAACAT 
CTGACGTTGC TGTTTGGTGC GGTGCTGCCT GCGTTAGTGA TTGGTGTGCC GTTGGGCATC 
TGGTGCTACT TTTCCACCGC GCGGCAGGGG GCGATTTTTT CTCTGCTCAA TGTCATTCAG 
ACCGTGCCTT CCGTGGCGCT CTTTGGCCTG CTGATTGCGC CGCTTGCCGG ACTGGTTACG 
GCCTTTCCGT GGCTGGGGAA GCTTGGCATA GCAGGAACCG GAATGACACC CGCACTGATT 
GCGCTGGTGC TCTATGCCTT GCTACCGCTG GTGCGCGGCG TGGTAGTCGG CTTGAACCAG 
ATCCCGCGCG ATGTGCTGGA GAGCGCCAGA GCGATGGGCA TGAGCGGGGC GCAGCGATTC 
CTGCATGTTC AGTTACCGCT GGCGTTACCG GTATTTCTGC GCAGCCTGCG GGTGGTGATG 
GTGCAAACTG TAGGCATGGC GGTGATTGCG GCGTTAATCG GCGCAGGCGG TTTTGGTGCG 
CTGGTTTTCC AGGGGCTGCT AAGCAGCGCC ATTGATTTAG TGTTGCTGGG GGTGATCCCG 
GTAATTGTTC TGGCGGTGCT GATCGATGCG CTGTTCGATT TACTAATCGC ACTGTTGAAG 
GTGAAACGTA ATGATTGA

Protein sequence

MTYLRINPVL ALLLLLTAIA AALPFISYAP NRLVSGEGRH LWQLWPQTIW MLVGVGCAWL 
TACFIPAKKG SIFALILAQF VFVLLVWGAG KAATQLAQNG SALARTSLGS GFWLASALAL 
LACSDAIRRI STHPLWRWLL HMQIAIIPLW LLYSGTLNDL SLMKEYANRQ DVFDDALAQH 
LTLLFGAVLP ALVIGVPLGI WCYFSTARQG AIFSLLNVIQ TVPSVALFGL LIAPLAGLVT 
AFPWLGKLGI AGTGMTPALI ALVLYALLPL VRGVVVGLNQ IPRDVLESAR AMGMSGAQRF 
LHVQLPLALP VFLRSLRVVM VQTVGMAVIA ALIGAGGFGA LVFQGLLSSA IDLVLLGVIP 
VIVLAVLIDA LFDLLIALLK VKRND