Gene B21_02255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02255
Symbol	ypdE
ID	8115837
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2381705
End bp	2382742
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	58%
IMG OID	644848459
Product	hypothetical protein
Protein accession	YP_003000032
Protein GI	251785728
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTAT CGCTATTAAA AGCGTTGAGC GAGGCAGATG CGATCGCCTC CTCGGAACAG 
GAAGTGCGGC AGATCCTGCT GGAAGAAGCG GATCGCCTGC AAAAAGAAGT GCGATTTGAT 
GGTCTGGGAT CGGTGCTGAT CCGCCTGAAT GAATCGACAG GTCCGAAGGT GATGATCTGT 
GCGCATATGG ACGAAGTGGG ATTTATGGTG CACAGCATCT CCCGCGAAGG GGCGATTGAT 
GTGCTGCCGG TTGGCAACGT ACGCATGGCT GCCCGCCAGC TGCAGCCGGT GCGCATCACC 
ACCCGTGAAG AGTGCAAAAT TCCAGGCCTG CTTGACGGCG ACCGGCAGGG GAATGACGTC 
AGCGCCATGC GCGTGGACAT TGGTGCGCGC TCCTATGACG AAGTGATGCA GGCGGGAATT 
CGTCCCGGCG ATCGCGTCAC GTTTGATACC ACTTTTCAGG TTCTCCCTCA CCAGCGAGTG 
ATGGGGAAAG CCTTTGATGA CCGCCTCGGT TGCTATCTGC TGGTGACGTT ACTGCGCGAA 
CTGCACGACG CCGAACTACC TGCGGAAGTG TGGCTGGTGG CAAGTTCCAG CGAAGAGGTG 
GGATTACGCG GCGGGCAAAC TGCCACCCGC GCGGTGTCGC CGGACGTCGC CATTGTGCTT 
GATACCGCCT GCTGGGCGAA AAACTTTGAT TATGGCGCGG CTAACCATCG CCAGATTGGT 
AACGGGCCGA TGCTGGTGTT AAGCGACAAG TCGCTGATTG CGCCGCCAAA ACTTACCGCC 
TGGGTCGAAA CCGTGGCGGC AGAAATTGGC GTGCCGTTGC AGGCAGATAT GTTCAGCAAC 
GGCGGCACGG ATGGCGGGGC GGTGCACTTA ACCGGCACCG GCGTGCCCAC AGTGGTGATG 
GGGCCAGCAA CCCGCCATGG ACATTGCGCC GCATCGATTG CCGATTGCCG CGACATTTTG 
CAGATGCAGC AACTTTTATC TGCCCTTATT CAACGTCTTA CGCGTGAGAC GGTTGTTCAA 
CTGACGGATT TCAGATGA

Protein sequence

MDLSLLKALS EADAIASSEQ EVRQILLEEA DRLQKEVRFD GLGSVLIRLN ESTGPKVMIC 
AHMDEVGFMV HSISREGAID VLPVGNVRMA ARQLQPVRIT TREECKIPGL LDGDRQGNDV 
SAMRVDIGAR SYDEVMQAGI RPGDRVTFDT TFQVLPHQRV MGKAFDDRLG CYLLVTLLRE 
LHDAELPAEV WLVASSSEEV GLRGGQTATR AVSPDVAIVL DTACWAKNFD YGAANHRQIG 
NGPMLVLSDK SLIAPPKLTA WVETVAAEIG VPLQADMFSN GGTDGGAVHL TGTGVPTVVM 
GPATRHGHCA ASIADCRDIL QMQQLLSALI QRLTRETVVQ LTDFR