Gene ECH74115_3317 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3317
Symbol
ID	6967116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3051565
End bp	3052590
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	53%
IMG OID	643387129
Product	ABC transporter, permease protein
Protein accession	YP_002271593
Protein GI	209398171
COG category	[R] General function prediction only
COG ID	[COG4239] ABC-type uncharacterized transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.655724
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.274397
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCGAC TCAACCCCGT CAATCAGGCC CGTTGGGCGC GTTTTCGCCA TAACCGTCGC 
GGCTACTGGT CGTTATGGAT TTTCCTCGTT TTGTTTGGTT TGAGTTTGTG TTCTGAACTT 
ATCGCCAACG ATAAACCGTT GCTGGTGCGT TATGACGGCA GTTGGTATTT CCCGTTGTTG 
AAAAACTACA GCGAAAGCGA TTTTGGCGGC CCGCTGGCAA GTCAGGCTGA TTATCAGGAC 
CCGTGGCTGA AACAACGGCT GGAAAATAAT GGCTGGGTAC TGTGGGCACC GATTCGCTTT 
GGTGCTACCA GTATCAACTT TGCTACCGAT AAGCCCTTCC CTTCTCCCCC CTCCCGGCAA 
AACTGGCTGG GAACGGATGC CAACGGCGGC GATGTGCTGG CACGTATTCT CTATGGCACG 
CGGATCTCGG TTCTGTTTGG CCTGATGCTG ACTCTCTGTT CCAGCGTGAT GGGCGTGCTG 
GCGGGGGCGC TACAAGGCTA TTACGGCGGT AAGGTCGATC TCTGGGGGCA GCGCTTTATT 
GAAGTATGGT CGGGGATGCC AACGCTGTTT TTGATTATTC TGCTTTCCAG CGTTGTGCAA 
CCTAACTTCT GGTGGCTGCT GGCAATTACT GTCTTATTTG GCTGGATGAG TCTGGTCGGC 
GTGGTGCGGG CGGAGTTTTT ACGTACCCGC AATTTCGACT ACATCCGCGC GGCACAGGCG 
CTTGGCGTCA GCGATCGCAG TATTATTCTG CGTCATATGT TGCCGAATGC AATGGTCGCT 
ACCCTCACCT TTTTACCGTT TATTTTATGT AGTTCGATCA CCACCCTGAC CTCACTCGAT 
TTCCTCGGCT TCGGTCTGCC GCTCGGTTCA CCGTCACTCG GTGAACTGCT GTTACAAGGG 
AAAAATAACC TTCAGGCTCC GTGGCTTGGG ATCACCGCCT TCTTGTCGGT GGCGATATTA 
TTGTCTTTGC TGATCTTTAT TGGTGAAGCC GTCCGCGACG CATTTGATCC TAATAAGGCG 
GTGTAG

Protein sequence

MSRLNPVNQA RWARFRHNRR GYWSLWIFLV LFGLSLCSEL IANDKPLLVR YDGSWYFPLL 
KNYSESDFGG PLASQADYQD PWLKQRLENN GWVLWAPIRF GATSINFATD KPFPSPPSRQ 
NWLGTDANGG DVLARILYGT RISVLFGLML TLCSSVMGVL AGALQGYYGG KVDLWGQRFI 
EVWSGMPTLF LIILLSSVVQ PNFWWLLAIT VLFGWMSLVG VVRAEFLRTR NFDYIRAAQA 
LGVSDRSIIL RHMLPNAMVA TLTFLPFILC SSITTLTSLD FLGFGLPLGS PSLGELLLQG 
KNNLQAPWLG ITAFLSVAIL LSLLIFIGEA VRDAFDPNKA V