Gene B21_02403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02403
Symbol	yphE
ID	8115855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2541865
End bp	2543376
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	56%
IMG OID	644848605
Product	hypothetical protein
Protein accession	YP_003000178
Protein GI	251785874
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.615581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCACGG CAACAGAGGC AGTCCCGGTA GCAAAAGTGG TGGCAGGAAA TAAGCGTTAT 
CCCGGCGTCG TTGCGCTGGA TAACGTTAAC TTCACGCTCA ATAAAGGCGA AGTTCGTGCG 
CTGTTAGGTA AAAACGGCGC GGGCAAATCG ACTCTCATTC GAATGCTTAC CGGCAGCGAA 
CGCCCGGATA GCGGTGATAT CTGGATTGGC GAGACGCGAC TGGAAGGTGA CGAAGCTACG 
CTGACTCGCC GTGCCGCTGA ACTGGGGGTG CGCGCGGTTT ATCAGGAGTT AAGTCTGGTG 
GAAGGGCTGA CAGTGGCGGA AAACCTCTGC CTCGGTCAGT GGCCCCGCCG CAACGGCATG 
ATTGATTACC TGCAAATGGC GCAGGATGCC CAACGTTGCT TACAGGCGCT GGGCGTTGAC 
GTTAGTCCTG AACAACTTGT TTCAACGCTA AGCCCGGCGC AAAAGCAGCT GGTGGAAATT 
GCGCGGGTGA TGAAGGGCGA GCCGCGCGTG GTCATTCTTG ATGAACCTAC CAGTTCGCTT 
GCGAGTGCGG AAGTTGAACT GGTGATCAGC GCGGTGAAAA AGATGTCGGC ACTGGGCGTG 
GCGGTGATTT ATGTCAGCCA CCGGATGGAA GAAATTCGCC GCATTGCCTC CTGTGCCACC 
GTTATGCGCG ATGGTCAGGT GGCGGGCGAT GTGATGCTCG AAAACACCTC CACGCATCAT 
ATTGTGTCGC TGATGCTCGG GCGCGATCAC GTTGATATTG CGCCGGTAGC CCCTCAGGAA 
ATTGTGGATC AGGCCGTGCT GGAAGTCCGT GCGTTACGCC ATAAGCCCAA GCTGGAGGAT 
ATCAGTTTTA CGCTACGTCG TGGCGAAGTG CTCGGCATTG CTGGTCTGCT GGGGGCAGGG 
CGCAGTGAAT TGCTGAAGGC GATTGTTGGG CTGGAGGAGT ATGAACAGGG CGAAATTGTT 
ATCAACGGCG AGAAAATCAC GCGCCCCGAT TACGGCGACA TGCTGAAACA CGGCATTGGC 
TATACGCCAG AAAACCGCAA AGAAGCGGGG ATCATTCCCT GGTTGGGCGT TGACGAAAAT 
ACAGTGCTGA CCAATCGGCA AAAAATCAGC GCCAACGGTG TGCTGCAATG GTCCACCATC 
CGCCGCCTGA CCGAAGAGGT GATGCAGCGG ATGACGGTCA AGGCCGCCAG TAGCGAAACA 
CCCATCGGCA CGCTTTCTGG TGGCAATCAG CAAAAAGTGG TGATCGGTCG TTGGGTCTAT 
GCTGCCAGCC AGATTTTGTT GCTCGACGAG CCAACGCGCG GCGTCGATAT CGAAGCCAAA 
CAGCAGATTT ACCGTATTGT CCGTGAGCTG GCTGCCGAAG GAAAAAGCGT GGTGTTTATC 
TCCAGTGAAG TGGAGGAGTT GCCGCTGGTG TGTGACCGCA TCCTGTTATT ACAGCACGGC 
ACGTTCTCGC AGGAGTTTCA CGCTCCGGTC AATGTGGATG AGCTGATGTC CGCCATTCTG 
TCTGTGCACT GA

Protein sequence

MFTATEAVPV AKVVAGNKRY PGVVALDNVN FTLNKGEVRA LLGKNGAGKS TLIRMLTGSE 
RPDSGDIWIG ETRLEGDEAT LTRRAAELGV RAVYQELSLV EGLTVAENLC LGQWPRRNGM 
IDYLQMAQDA QRCLQALGVD VSPEQLVSTL SPAQKQLVEI ARVMKGEPRV VILDEPTSSL 
ASAEVELVIS AVKKMSALGV AVIYVSHRME EIRRIASCAT VMRDGQVAGD VMLENTSTHH 
IVSLMLGRDH VDIAPVAPQE IVDQAVLEVR ALRHKPKLED ISFTLRRGEV LGIAGLLGAG 
RSELLKAIVG LEEYEQGEIV INGEKITRPD YGDMLKHGIG YTPENRKEAG IIPWLGVDEN 
TVLTNRQKIS ANGVLQWSTI RRLTEEVMQR MTVKAASSET PIGTLSGGNQ QKVVIGRWVY 
AASQILLLDE PTRGVDIEAK QQIYRIVREL AAEGKSVVFI SSEVEELPLV CDRILLLQHG 
TFSQEFHAPV NVDELMSAIL SVH