Gene ECH74115_4682 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4682
Symbol	frlA
ID	6970474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4322905
End bp	4324242
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	55%
IMG OID	643388386
Product	putative fructoselysine transporter
Protein accession	YP_002272814
Protein GI	209396621
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAGCC AGGAACTCCA ACGCAAGCTC GGATTTTGGG CCGTTCTTGC AATCGCCGTC 
GGGACAACCG TCGGCTCCGG TATTTTTGTA TCTGTGGGTG AAGTGGCAAA AGCGGCGGGC 
ACGCCGTGGC TGACGGTGCT CGCATTTGTC ATCGGCGGGT TAATTGTGAT CCCGCAAATG 
TGCGTATATG CGGAACTATC CACCGCTTAT CCGGAAAATG GCGCAGATTA TGTTTATCTG 
AAAAATGCCG GAAGCCGACC GCTGGCTTTC CTCTCCGGCT GGGCCAGCTT CTGGGCCAAC 
GATGCGCCGT CATTGTCGAT TATGGCGCTG GCGATTGTCA GCAATCTTGG CTTTTTAACG 
CCTATCGATC CGTTGCTCGG TAAATTTATC GCCGCCGGAT TAATTATCGC CTTTATGCTG 
CTGCACCTGC GCTCCGTTGA AGGCGGCGCA GCGTTTCAGA CGCTAATTAC CATCGCCAAA 
ATTATCCCGT TCACTATCGT CATTGGTCTT GGGATCTTCT GGTTTAAAGC GGAGAATTTT 
GCCGCCCCTG CTACCACTGC GATTGGCGCA ACGGGCAGCT TTATGGCGCT GCTGGCGGGG 
ATCTCTGCCA CCAGTTGGTC GTATACCGGC ATGGCCTCTA TCTGTTATAT GACCGGCGAA 
ATTAAAAACC CCGGCAAAAC CATGCCACGA GCGCTGATTG GTTCCTGTCT GCTGGTTCTG 
GTGCTCTACA CCCTGCTGGC GCTGGTGATT TCCGGCCTGA TGCCCTTCGA CAAACTCGCC 
AATTCTGAAA CGCCGATTTC CGACGCCCTG ACCTGGATCC CCGCACTCGG CAGCACCGCT 
GGGATCTTTG TTGCCATCAC GGCGATGATC GTCATTCTTG GTTCGCTTTC CAGCTGCGTG 
ATGTACCAGC CGCGGCTGGA ATACGCGATG GCGAAAGACA ACCTGTTCTT CAAATGCTTC 
GGCCATGTGC ATCCGAAATA CAACACGCCG GATGTCTCCA TCATTTTGCA AGGGGCGCTG 
GGGATCTTCT TCATCTTCGT TTCCGATCTC ACCAGCCTGC TGGGCTATTT CACCCTGGTA 
ATGTGTTTCA AAAATACCCT CACCTTCGGC TCCATCATCT GGTGTCGTAA ACGCGACGAT 
TACAAACCGC TGTGGCGTAC TCCGGCTTTC GGGCTGATGA CCCCCCTCGC CATTGCGTCA 
AGCCTCATTC TGGTCGCCTC AACCTTTGTC TGGGCACCGA TTCCCGGCCT TATCTGCGCC 
GTCATCGTTA TTGCCACTGG TCTGCCTGCT TACGCCTTCT GGGCGAAGCG TAGCCGCCAG 
CTCAACGCTT TGTCGTAA

Protein sequence

MGSQELQRKL GFWAVLAIAV GTTVGSGIFV SVGEVAKAAG TPWLTVLAFV IGGLIVIPQM 
CVYAELSTAY PENGADYVYL KNAGSRPLAF LSGWASFWAN DAPSLSIMAL AIVSNLGFLT 
PIDPLLGKFI AAGLIIAFML LHLRSVEGGA AFQTLITIAK IIPFTIVIGL GIFWFKAENF 
AAPATTAIGA TGSFMALLAG ISATSWSYTG MASICYMTGE IKNPGKTMPR ALIGSCLLVL 
VLYTLLALVI SGLMPFDKLA NSETPISDAL TWIPALGSTA GIFVAITAMI VILGSLSSCV 
MYQPRLEYAM AKDNLFFKCF GHVHPKYNTP DVSIILQGAL GIFFIFVSDL TSLLGYFTLV 
MCFKNTLTFG SIIWCRKRDD YKPLWRTPAF GLMTPLAIAS SLILVASTFV WAPIPGLICA 
VIVIATGLPA YAFWAKRSRQ LNALS