Gene ECH74115_2096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2096
Symbol
ID	6968880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1993874
End bp	1994860
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	54%
IMG OID	643385997
Product	ABC transporter, ATP-binding protein
Protein accession	YP_002270486
Protein GI	209396279
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAAC CCGTTCTGGA CATTCAACAA CTGCATTTGA GTTTCCCCGG TTTTAACGGC 
GACGTTCACG CGCTCAACAA TGTGTCCTTG CAGATTAACC GCGGTGAAAT TGTCGGTCTG 
GTGGGAGAAT CCGGCTCAGG TAAATCAGTC ACCGCAATGC TGATTATGCG TCTGCTACCG 
ACGGGCAGTT ATTGCGTACA TCGGGGGCAG ATTTCACTGC TGGGAGACGA TGTTCTTAAC 
GCGCGGGAAA AACAGCTTCG TCAGTGGCGC GGCGCACGAG TGGCGATGAT CTTTCAGGAA 
CCGATGACCG CCCTCAATCC GACACGTCGA ATAGGTCTTC AGATGATGGA CGTGATCCGC 
CATCATCAAC CAATAAGTCG TCGGGAAGCC AGAGCTAAAG CGATTGCCCT GCTGGAAGAG 
ATGCAAATCC CGGATACCGT GGAAGTTATG TCGCGCTATC CGTTTGAGCT TTCAGGTGGT 
ATGCGCCAGC GGGTAATGAT TGCGCTGGCA TTCTCCTGCG AACCGCAATT GATTATTGCC 
GACGAACCGA CTACGGCGCT GGACGTCACG GTACAGTTGC AGGTACTGCG TTTGCTTAAA 
CATAAAGCTC GCGACAGTGG AACTGCGGTA CTGTTCATCA GCCATGATAT GGCCGTGGTG 
TCGCAACTGT GCGATAGCGT TTACGTGATG TATGCCGGAA GCGTGATTGA GAGCGGCGTG 
ACGGCAGACG TTATCCATCA TCCCCGGCAT CCGTATACCA TTGGTTTGCT GCAATGCGCA 
CCAGAACATG GAGTACCACG CCAGCCATTA CCCGCCATTC CAGGGACGGT ACCAAATCTC 
ACCCATTTGC CTGACGGCTG CGCTTTTCGC GATCGTTGCT ATGCGGCAGG TGCACAGTGT 
GAAAACGTCC CGGCGCTGAC AGCGTGTGGT GACAACAACC AGCGCTGCGC CTGTTGGTAT 
CCGCAGCAGG AGGTCATAAG TGTCTGA

Protein sequence

MTQPVLDIQQ LHLSFPGFNG DVHALNNVSL QINRGEIVGL VGESGSGKSV TAMLIMRLLP 
TGSYCVHRGQ ISLLGDDVLN AREKQLRQWR GARVAMIFQE PMTALNPTRR IGLQMMDVIR 
HHQPISRREA RAKAIALLEE MQIPDTVEVM SRYPFELSGG MRQRVMIALA FSCEPQLIIA 
DEPTTALDVT VQLQVLRLLK HKARDSGTAV LFISHDMAVV SQLCDSVYVM YAGSVIESGV 
TADVIHHPRH PYTIGLLQCA PEHGVPRQPL PAIPGTVPNL THLPDGCAFR DRCYAAGAQC 
ENVPALTACG DNNQRCACWY PQQEVISV