Gene B21_01504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01504
Symbol	ydeE
ID	8116549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	1570039
End bp	1571226
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	50%
IMG OID	644847738
Product	hypothetical protein
Protein accession	YP_002999311
Protein GI	251785007
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.054912
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTTAT CCCTACGACG CTCTACCAGC GCCCTTCTTG CCTCGTCGTT GTTATTAACC 
ATCGGACGCG GCGCTACGCT GCCATTTATG ACCATTTACT TGAGTCGCCA GTACAGCCTG 
AGTGTCGATC TAATCGGTTA TGCGATGACA ATTGCGCTCA CTATTGGCGT CGTTTTTAGC 
CTCGGTTTTG GTATCCTGGC GGATAAGTTC GACAAGAAAC GCTATATGTT ACTGGCAATT 
ACCGCCTTCG CCAGCGGTTT TATTGCCATT CCTTTAGTGA ATAACGTAAC GCTGGTGGTG 
CTATTTTTTG CCCTTATTAA CTGCGCCTAT TCCGTTTTTG CTACCGTGTT GAAAGCCTGG 
TTTGCCGACA ATCTTTCGTC CACCAGCAAA ACGAAAATCT TCTCAATCAA CTACACCATG 
CTAAACATTG GCTGGACCAT CGGTCCGCCG CTCGGCACGC TGTTGGTGAT GCAGAGCATC 
AATCTGCCTT TTTGGCTGGC AGCTATCTGT TCCGCGTTCC CCATGCTTTT CATTCAAATT 
TGGGTAAAGC GCAGCGAGAA AATCATCGCC ACGGATACAG GCAGTGTCTG GTCGCCGAAA 
GTTTTATTAC AAGATAAAGC ACTGTTGTGG TTTACCTGCT CTGGTTTTCT GGCTTCTTTT 
GTTAGCGGCG CATTTGCTTC ATGCATTTCA CAATATGTGA TGGTGATTGC TGATGGGGAT 
TTTGCCGAAA AGGTGGTCGC GGTTGTTCTT CCGGTGAATG CTGCCATGGT GGTTACGTTG 
CAATATTCCG TGGGCCGCCG CCTTAACCCG GCTAACATCC GCGCGCTGAT GACAGCAGGC 
ACCCTCTGTT TCGTCATCGG TCTGGTCGGT TTTATTTTTT CCGGCAACAG CCTGCTATTG 
TGGGGTATGT CAGCTGCGGT ATTTACTGTC GGTGAAATCA TTTATGCGCC GGGCGAGTAT 
ATGTTGATTG ACCATATTGC GCCGCCAGGA ATGAAAGCCA GCTATTTTTC CGCCCAGTCT 
TTAGGCTGGC TTGGTGCCGC GATTAACCCA TTAGTGAGTG GCGTAGTGCT AACCAGCCTG 
CCGCCTTCCT CGCTGTTTGT CATCTTAGCG TTGGTGATCA TTGCTGCGTG GGTGCTGATG 
TTAAAAGGAA TTCGGGCAAG ACCGTGGGGG CAGCCCGCGC TTTGTTGA

Protein sequence

MNLSLRRSTS ALLASSLLLT IGRGATLPFM TIYLSRQYSL SVDLIGYAMT IALTIGVVFS 
LGFGILADKF DKKRYMLLAI TAFASGFIAI PLVNNVTLVV LFFALINCAY SVFATVLKAW 
FADNLSSTSK TKIFSINYTM LNIGWTIGPP LGTLLVMQSI NLPFWLAAIC SAFPMLFIQI 
WVKRSEKIIA TDTGSVWSPK VLLQDKALLW FTCSGFLASF VSGAFASCIS QYVMVIADGD 
FAEKVVAVVL PVNAAMVVTL QYSVGRRLNP ANIRALMTAG TLCFVIGLVG FIFSGNSLLL 
WGMSAAVFTV GEIIYAPGEY MLIDHIAPPG MKASYFSAQS LGWLGAAINP LVSGVVLTSL 
PPSSLFVILA LVIIAAWVLM LKGIRARPWG QPALC