Gene ECD_02439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02439
Symbol	yphE
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	2542655
End bp	2544166
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	56%
IMG OID
Product	fused predicted sugar transporter subunits of ABC superfamily: ATP-binding components
Protein accession	ACT44259
Protein GI	253978589
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.978258
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCACGG CAACAGAGGC AGTCCCGGTA GCAAAAGTGG TGGCAGGAAA TAAGCGTTAT 
CCCGGCGTCG TTGCGCTGGA TAACGTTAAC TTCACGCTCA ATAAAGGCGA AGTTCGTGCG 
CTGTTAGGTA AAAACGGCGC GGGCAAATCG ACTCTCATTC GAATGCTTAC CGGCAGCGAA 
CGCCCGGATA GCGGTGATAT CTGGATTGGC GAGACGCGAC TGGAAGGTGA CGAAGCTACG 
CTGACTCGCC GTGCCGCTGA ACTGGGGGTG CGCGCGGTTT ATCAGGAGTT AAGTCTGGTG 
GAAGGGCTGA CAGTGGCGGA AAACCTCTGC CTCGGTCAGT GGCCCCGCCG CAACGGCATG 
ATTGATTACC TGCAAATGGC GCAGGATGCC CAACGTTGCT TACAGGCGCT GGGCGTTGAC 
GTTAGTCCTG AACAACTTGT TTCAACGCTA AGCCCGGCGC AAAAGCAGCT GGTGGAAATT 
GCGCGGGTGA TGAAGGGCGA GCCGCGCGTG GTCATTCTTG ATGAACCTAC CAGTTCGCTT 
GCGAGTGCGG AAGTTGAACT GGTGATCAGC GCGGTGAAAA AGATGTCGGC ACTGGGCGTG 
GCGGTGATTT ATGTCAGCCA CCGGATGGAA GAAATTCGCC GCATTGCCTC CTGTGCCACC 
GTTATGCGCG ATGGTCAGGT GGCGGGCGAT GTGATGCTCG AAAACACCTC CACGCATCAT 
ATTGTGTCGC TGATGCTCGG GCGCGATCAC GTTGATATTG CGCCGGTAGC CCCTCAGGAA 
ATTGTGGATC AGGCCGTGCT GGAAGTCCGT GCGTTACGCC ATAAGCCCAA GCTGGAGGAT 
ATCAGTTTTA CGCTACGTCG TGGCGAAGTG CTCGGCATTG CTGGTCTGCT GGGGGCAGGG 
CGCAGTGAAT TGCTGAAGGC GATTGTTGGG CTGGAGGAGT ATGAACAGGG CGAAATTGTT 
ATCAACGGCG AGAAAATCAC GCGCCCCGAT TACGGCGACA TGCTGAAACA CGGCATTGGC 
TATACGCCAG AAAACCGCAA AGAAGCGGGG ATCATTCCCT GGTTGGGCGT TGACGAAAAT 
ACAGTGCTGA CCAATCGGCA AAAAATCAGC GCCAACGGTG TGCTGCAATG GTCCACCATC 
CGCCGCCTGA CCGAAGAGGT GATGCAGCGG ATGACGGTCA AGGCCGCCAG TAGCGAAACA 
CCCATCGGCA CGCTTTCTGG TGGCAATCAG CAAAAAGTGG TGATCGGTCG TTGGGTCTAT 
GCTGCCAGCC AGATTTTGTT GCTCGACGAG CCAACGCGCG GCGTCGATAT CGAAGCCAAA 
CAGCAGATTT ACCGTATTGT CCGTGAGCTG GCTGCCGAAG GAAAAAGCGT GGTGTTTATC 
TCCAGTGAAG TGGAGGAGTT GCCGCTGGTG TGTGACCGCA TCCTGTTATT ACAGCACGGC 
ACGTTCTCGC AGGAGTTTCA CGCTCCGGTC AATGTGGATG AGCTGATGTC CGCCATTCTG 
TCTGTGCACT GA

Protein sequence

MFTATEAVPV AKVVAGNKRY PGVVALDNVN FTLNKGEVRA LLGKNGAGKS TLIRMLTGSE 
RPDSGDIWIG ETRLEGDEAT LTRRAAELGV RAVYQELSLV EGLTVAENLC LGQWPRRNGM 
IDYLQMAQDA QRCLQALGVD VSPEQLVSTL SPAQKQLVEI ARVMKGEPRV VILDEPTSSL 
ASAEVELVIS AVKKMSALGV AVIYVSHRME EIRRIASCAT VMRDGQVAGD VMLENTSTHH 
IVSLMLGRDH VDIAPVAPQE IVDQAVLEVR ALRHKPKLED ISFTLRRGEV LGIAGLLGAG 
RSELLKAIVG LEEYEQGEIV INGEKITRPD YGDMLKHGIG YTPENRKEAG IIPWLGVDEN 
TVLTNRQKIS ANGVLQWSTI RRLTEEVMQR MTVKAASSET PIGTLSGGNQ QKVVIGRWVY 
AASQILLLDE PTRGVDIEAK QQIYRIVREL AAEGKSVVFI SSEVEELPLV CDRILLLQHG 
TFSQEFHAPV NVDELMSAIL SVH