Gene B21_04033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_04033
Symbol	ybl210
ID	8113916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	4331272
End bp	4332549
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	47%
IMG OID	644850183
Product	hypothetical protein
Protein accession	YP_003001756
Protein GI	251787452
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAA TAAAGAATTA CCGGTGGCAT ATGATTGCCC TCGTATGCTT TATCACTGTA 
ATCAATTATC TGGACAGAAC GGCATTAGGT ATTGCGGCTC CAACGATTAT GGAGACAACC 
GGAATAACTA AAGAGCAATA TTCATGGATT GTCAGTGCAT TCCAGTTGGC CTATACATTA 
GGGCAACCGG TAATGGGCTT CTTTATTGAT ACCGTGGGTC TGAAGTTAAG TTTTGCGATA 
TGTGCCGCAA TTTGGGGCCT GGCGACAATG GGCCATGCAC TCACCGGAAC GTGGTCTGGT 
CTGGCATTTA TGCGCGCCCT GATGGGTTTC AGCGAAGCGT CGGCAATTCC GGCGGGTGTA 
AAAACCGCAT CAACATGGTT CCCGGCAAAA GAGCGTGGCG TGGCGACAGG TGTTTTCAAT 
ATGGGCACCT CACTCGGCGC GATGCTTGCT CCACCGTTGA TTGCCTGGTG CATTATGTTT 
CATAGCTGGC AATTTGCGTT TATTGTTTCA GGTAGCCTTG CTTTGCTCGC GGCTTTATTT 
TGGTTCTTTT GTTATAAAGA TCCGAAAGAT GCCAAACGCC TTTCTGATGA AGAGCGCCAC 
TATATTGAAT CAGGACAAGA ACAGCATCTT AAAACAGATA AGAAAGAAAA AACGTCAATC 
AAGCATATCC TCAGCCAACG TAATTTCTGG GGGATTGGCA TCGCGCGTTT TCTCGCAGAC 
CCGGCATGGG GAACCATTAA CTTCTGGGTG CCGATTTTCT TCGTCGAAAC GCTGCATTTT 
AGCCTGAAAG AAATTGCCAT GTTCGTCTGG CTGCCTTTCC TGCTGGGCGA TCTCGGCTGT 
TTAGCCAGTG GTTTTGTCGC GAAGTTCTTC CACGATCGCG GCGTGAGTTT AATTAACTCA 
CGAAGAATTA CCTTCACTAT TGCAGCCGTC ATTATGATGA CGATTGGCCT GGTGAGTATT 
GTCGAAAATC CCTACATTGC CGTATTACTG ATTAGTATTG GCGCGTTCTC GCATCAATGT 
CTTTCTACTG TAGCAGCAAC TCTGGGTGGC GATCTGTTCA AAAAAGACGA AGTAGCTACC 
GCAGTGGGTA TGGCAGGAGC CTGTGCGTGG AGCGGTCAGT TGATTTTCAA CCTGTTTATC 
GGGGCATTCG TTCACATTAT CGGCTTCGCG CCGTTCTTTA TTGCCCTGGC TTTCTTTGAC 
ATTATTGGCG CCATTGCGCT GTGGACGCTT ATCAAAGTTA AAGATGAAGA ACCGCAAGTA 
CAGTTAGCGA CAAGCTAA

Protein sequence

MNKIKNYRWH MIALVCFITV INYLDRTALG IAAPTIMETT GITKEQYSWI VSAFQLAYTL 
GQPVMGFFID TVGLKLSFAI CAAIWGLATM GHALTGTWSG LAFMRALMGF SEASAIPAGV 
KTASTWFPAK ERGVATGVFN MGTSLGAMLA PPLIAWCIMF HSWQFAFIVS GSLALLAALF 
WFFCYKDPKD AKRLSDEERH YIESGQEQHL KTDKKEKTSI KHILSQRNFW GIGIARFLAD 
PAWGTINFWV PIFFVETLHF SLKEIAMFVW LPFLLGDLGC LASGFVAKFF HDRGVSLINS 
RRITFTIAAV IMMTIGLVSI VENPYIAVLL ISIGAFSHQC LSTVAATLGG DLFKKDEVAT 
AVGMAGACAW SGQLIFNLFI GAFVHIIGFA PFFIALAFFD IIGAIALWTL IKVKDEEPQV 
QLATS