Gene B21_02048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02048
Symbol	yeiI
ID	8112971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2145911
End bp	2146999
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	52%
IMG OID	644848258
Product	hypothetical protein
Protein accession	YP_002999831
Protein GI	251785527
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0826049
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAACC GGGAAAAGGA GATCCTTGCA ATTTTACGGC GTAACCCGCT GATTCAGCAG 
AACGAAATTG CGGACATGCT GCAAATCAGT CGTTCGCGCG TTGCAGCGCA TATTATGGAT 
TTAATGCGCA AAGGGCGGAT TAAAGGCAAA GGTTACATTC TCACCGAGCA GGAATACTGC 
GTAGTGGTGG GGACAATCAA TATGGATATT CGCGGGATGG CGGATATCCG TTACCCGCAA 
GCGGCTTCTC ATCCCGGTAC AATTCATTGC TCGGCGGGCG GCGTGGGACG CAACATCGCC 
CACAATCTGG CGCTGTTAGG CCGTGACGTC CATTTGCTTT CAGTGATTGG CGATGACTTT 
TATGGCGAAA TGCTCCTGGA AGAAACGCGC CGTGCCGGCG TGAATGTCTC CGGCTGCGTT 
CGTTTGCATG GTCAAAGCAC ATCGACGTAT CTGGCAATTG CCAATCGAGA CGATCAAACC 
GTGCTGGCGA TTAACGATAC CCATCTGCTG GAACAGTTGA CACCGCAACT ACTGAACGGG 
TCGCGCGATT TACTTCGTCA TGCGGGCGTG GTACTGGCTG ATTGCAACCT GACAGCCGAG 
GCGCTGGAAT GGGTCTTTAC CCTCGCTGAT GAAATCCCGG TGTTTGTCGA TACCGTTTCA 
GAATTCAAAG CGGGCAAAAT CAAACACTGG CTGGCGCATA TTCACACCCT GAAACCCACT 
TTACCGGAGC TGGAAATTTT ATGGGGACAG GCGATCACCA GCGATGCTGA CCGTAATGCC 
GCAGTGAATG CATTGCATCA GCAAGGTGTT CAGCAACTGT TTGTTTATTT GCCCGATGAG 
TCAGTTTATT GCAGCGAAAA GGATGGAGAA CAATTTTTGC TGACCGCGCC AGCGCATACG 
ACAGTAGACA GTTTTGGTGC TGACGATGGT TTTATGGCGG GCCTGGTATA TAGCTTTCTT 
GAAGGATACA GTTTCCGCGA CAGCGCCCGT TTTGCGGTAG CCTGCGCGGC AATTTCGCGC 
GCCAGCGGCA GCTTAAACAA CCCTACCCTG TCTGCCGATA ACGCGCTTTC ATTAGTGCCA 
ATGGTGTAA

Protein sequence

MNNREKEILA ILRRNPLIQQ NEIADMLQIS RSRVAAHIMD LMRKGRIKGK GYILTEQEYC 
VVVGTINMDI RGMADIRYPQ AASHPGTIHC SAGGVGRNIA HNLALLGRDV HLLSVIGDDF 
YGEMLLEETR RAGVNVSGCV RLHGQSTSTY LAIANRDDQT VLAINDTHLL EQLTPQLLNG 
SRDLLRHAGV VLADCNLTAE ALEWVFTLAD EIPVFVDTVS EFKAGKIKHW LAHIHTLKPT 
LPELEILWGQ AITSDADRNA AVNALHQQGV QQLFVYLPDE SVYCSEKDGE QFLLTAPAHT 
TVDSFGADDG FMAGLVYSFL EGYSFRDSAR FAVACAAISR ASGSLNNPTL SADNALSLVP 
MV