Gene ECD_03221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03221
Symbol	yhfM
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	3359511
End bp	3360848
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	55%
IMG OID
Product	predicted fructoselysine transporter
Protein accession	ACT45025
Protein GI	253979355
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAGCC AGGAACTCCA ACGCAAGCTC GGATTTTGGG CCGTTCTTGC AATCGCCGTC 
GGGACAACCG TCGGCTCCGG TATTTTTGTA TCTGTGGGTG AAGTGGCAAA AGCAGCGGGC 
ACGCCGTGGC TTACGGTGCT CGCGTTTGTC ATTGGCGGGT TAATTGTGAT CCCGCAAATG 
TGCGTCTATG CGGAACTATC CACCGCTTAT CCGGAAAATG GCGCAGATTA TGTTTATCTG 
AAAAATGCCG GAAGCCGACC GCTGGCTTTC CTCTCCGGCT GGGCCAGCTT CTGGGCCAAC 
GATGCGCCGT CATTGTCGAT TATGGCGCTG GCGATTGTCA GCAATCTTGG CTTTTTAACG 
CCTATCGATC CGTTGCTCGG TAAATTTATC GCCGCCGGAT TAATTATCGC CTTTATGTTG 
CTACACCTGC GCTCCGTTGA AGGCGGCGCA GCGTTTCAGA CGCTAATTAC CATCGCCAAA 
ATTATCCCGT TCACTATCGT CATTGGCCTT GGGATCTTCT GGTTTAAAGC GGAGAATTTT 
GCCGCCCCTA CCACCACTGC GATTGGCGCA ACGGGCAGCT TTATGGCGCT GCTGGCGGGG 
ATCTCTGCCA CCAGTTGGTC GTATACCGGC ATGGCCTCTA TCTGTTATAT GACCGGCGAA 
ATTAAAAACC CCGGAAAAAC CATGCCACGA GCGCTGATTG GTTCCTGTCT GCTGGTTCTG 
GTGCTCTACA CCCTGCTGGC GCTGGTGATT TCCGGCCTGA TGCCCTTCGA CAAACTCGCC 
AATTCTGAAA CGCCGATTTC CGACGCCCTG ACCTGGATCC CCGCACTCGG CAGCACCGCT 
GGGATCTTTG TTGCCATCAC GGCGATGATC GTCATTCTTG GTTCGCTTTC CAGCTGCGTG 
ATGTACCAGC CGCGGCTGGA ATACGCGATG GCGAAAGACA ACCTGTTCTT TAAATGCTTC 
GGCCATGTGC ATCCGAAATA CAACACGCCG GATGTCTCCA TCATCCTGCA AGGGGCGCTG 
GGGATCTTCT TCATCTTCGT TTCCGATCTC ACCAGCCTGC TGGGTTATTT CACCCTGGTG 
ATGTGTTTCA AAAATACCCT CACCTTCGGC TCCATCATCT GGTGTCGTAA ACGCGACGAT 
TACAAACCGC TGTGGCGTAC TCCGGCTTTC GGGCTGATGA CCACCCTCGC CATTGCGTCA 
AGCCTCATTC TGGTCGCCTC AACCTTTGTC TGGGCACCGA TTCCCGGCCT TATCTGCGCC 
GTCATCGTTA TTGCTACTGG TCTGCCTGCT TACGCCTTCT GGGCGAAGCG TAGCCGCCAG 
CTCAACGCTT TGTCGTAA

Protein sequence

MGSQELQRKL GFWAVLAIAV GTTVGSGIFV SVGEVAKAAG TPWLTVLAFV IGGLIVIPQM 
CVYAELSTAY PENGADYVYL KNAGSRPLAF LSGWASFWAN DAPSLSIMAL AIVSNLGFLT 
PIDPLLGKFI AAGLIIAFML LHLRSVEGGA AFQTLITIAK IIPFTIVIGL GIFWFKAENF 
AAPTTTAIGA TGSFMALLAG ISATSWSYTG MASICYMTGE IKNPGKTMPR ALIGSCLLVL 
VLYTLLALVI SGLMPFDKLA NSETPISDAL TWIPALGSTA GIFVAITAMI VILGSLSSCV 
MYQPRLEYAM AKDNLFFKCF GHVHPKYNTP DVSIILQGAL GIFFIFVSDL TSLLGYFTLV 
MCFKNTLTFG SIIWCRKRDD YKPLWRTPAF GLMTTLAIAS SLILVASTFV WAPIPGLICA 
VIVIATGLPA YAFWAKRSRQ LNALS