Gene ECH74115_2095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2095
Symbol
ID	6969459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1992955
End bp	1993881
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	54%
IMG OID	643385996
Product	putative ABC transport system ATP-binding protein
Protein accession	YP_002270485
Protein GI	209397883
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1124] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGACA CGTTATTAAC GTTACGCGAC GTCCATATCA ATTTCCCGGC GCGTAAAAAC 
TGGCTTGGTA AAACTACGGA ACATGTTCAT GCCATTAATG GTATTGATTT ACAGATCCGC 
CGTGGTGAAA CCTTAGGGAT CGTCGGCGAG TCAGGCTGCG GCAAAAGCAC CCTCGCACAG 
CTTTTAATGG GTATGCTGCA ACCGAGCCAC GGGCAGTACA TCCGTTCTGG CTCACAACGC 
ATTATGCAGA TGATGTTTCA GGACCCGCTC TCTTCGCTTA ATCCGCGCTT ACCGGTGTGG 
CGCATCATCA CAGAACCGCT CTGGATAGCT AAGCATAGTA GTGAACAACA GCGGCGAGCG 
TTGGCAGAGG AGCTGGCTGT GCAGGTGGGT ATTCGTCCGG AGTATCTCGA CCGCCTGCCT 
CATGCGTTCT CCGGCGGGCA GCGGCAACGC ATCGCCATTG CCAGAGCACT CTCTTCGCAG 
CCTGACGTGA TTGTGCTTGA TGAGCCAACC TCTGCGCTGG ATATCTCCGT GCAGGCGCAG 
ATCCTCAATT TACTGGTAAC GCTACAGGAA AATCACGGGC TGACTTATGT GCTGATTTCA 
CACAATGTCT CGGTGATACG TCATATGAGC GATCGGGTGG CGGTGATGTA TCTCGGGCAG 
ATTGTGGAAT TAGGGGAAGC GCAACAGGTG CTAACGGCTC CGGCACATCC ATACACCCGA 
TTATTGCTGG ATTCCCTCCC CGCCATTGAT AAACCACTGG AGGAAGAATG GGCATTACGT 
AAAACGGATC TGCCAGGAAA CCGCACGTTG CCACAGGGCT GTTTTTTCCG CGAACGTTGC 
CCCCTTGCAA CCAGCGGATG CGAAGTCCGG CAATCATTAA CGACGCGGGC TGACGGACGT 
GAGATCCGTT GCTGGCGGGC GCTGTAG

Protein sequence

MSDTLLTLRD VHINFPARKN WLGKTTEHVH AINGIDLQIR RGETLGIVGE SGCGKSTLAQ 
LLMGMLQPSH GQYIRSGSQR IMQMMFQDPL SSLNPRLPVW RIITEPLWIA KHSSEQQRRA 
LAEELAVQVG IRPEYLDRLP HAFSGGQRQR IAIARALSSQ PDVIVLDEPT SALDISVQAQ 
ILNLLVTLQE NHGLTYVLIS HNVSVIRHMS DRVAVMYLGQ IVELGEAQQV LTAPAHPYTR 
LLLDSLPAID KPLEEEWALR KTDLPGNRTL PQGCFFRERC PLATSGCEVR QSLTTRADGR 
EIRCWRAL