Gene B21_04072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_04072
Symbol	treB
ID	8112839
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	4374492
End bp	4375913
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	54%
IMG OID	644850220
Product	hypothetical protein
Protein accession	YP_003001793
Protein GI	251787489
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00852] PTS system, maltose and glucose-specific subfamily, IIC component [TIGR01992] PTS system, trehalose-specific IIBC component

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAGCA AAATAAACCA AACGGATATC GATCGGTTGA TTGAACTGGT CGGCGGGCGC 
GGCAATATTG CGACGGTGAG CCACTGTATT ACTCGCCTGC GCTTTGTCCT CAACCAACCG 
GCCAATGCCA GACCGAAAGA AATTGAGCAA CTCCCCATGG TGAAAGGCTG TTTCACCAAT 
GCCGGGCAAT TTCAGGTGGT GATTGGCACC AACGTGGGTG ATTACTATCA AGCACTAATA 
GCGTCAACCG GACAGGCGCA GGTTGATAAA GAGCAGGTAA AAAAAGCCGC CCGGCAGAAT 
ATGAAATGGC ATGAGCAGTT GATCTCTCAT TTCGCGGAGA TCTTCTTCCC GTTGCTGCCC 
GCGTTGATTA GCGGCGGTTT GATCCTCGGT TTTCGCAATG TGATCGGCGA TTTGCCCATG 
AGCAACGGTC AGACGCTGGC GCAAATGTAC CCTTCCCTGC AAACGATCTA CGATTTTCTG 
TGGTTGATCG GTGAAGCGAT CTTCTTCTAC CTGCCGGTCG GTATTTGCTG GTCAGCGGTG 
AAAAAAATGG GCGGCACGCC GATCCTTGGT ATCGTGCTTG GCGTGACACT GGTTTCTCCC 
CAGCTGATGA ACGCTTATCT GCTCGGGCAG CAGCTGCCGG AAGTGTGGGA CTTTGGCATG 
TTCAGCATCG CCAAAGTGGG CTATCAGGCA CAGGTGATCC CGGCACTGTT AGCCGGGCTG 
GCACTGGGCG TTATTGAAAC TCGCCTTAAA CGCATCGTAC CGGATTACCT CTATCTGGTG 
GTGGTGCCCG TCTGTTCGCT GATCCTCGCG GTGTTCCTCG CCCATGCGCT GATTGGTCCG 
TTTGGTCGCA TGATTGGCGA TGGCGTTGCC TTTGCGGTAC GTCACCTGAT GACCGGCAGC 
TTTGCTCCGA TTGGTGCGGC ATTGTTTGGC TTCCTGTACG CGCCGCTGGT GATCACCGGC 
GTACACCAGA CCACCCTTGC TATTGATTTG CAGATGATTC AAAGCATGGG TGGCACGCCA 
GTGTGGCCGC TGATTGCGCT GTCGAATATC GCTCAGGGCT CCGCCGTGAT AGGCATTATC 
ATTTCCAGCC GCAAGCACAA TGAACGCGAG ATCTCCGTGC CTGCCGCTAT CTCCGCCTGG 
CTTGGGGTCA CTGAGCCTGC AATGTACGGC ATCAACCTGA AATATCGCTT CCCGATGCTG 
TGCGCGATGA TTGGTTCTGG TCTGGCAGGA TTACTATGCG GCCTGAACGG CGTTATGGCG 
AATGGTATCG GCGTAGGCGG CCTGCCGGGA ATTCTCTCGA TTCAACCGAG CTACTGGCAG 
GTATTTGCGC TGGCAATGGT TATCGCCATC ATCATCCCGA TTGTACTCAC CTCGTTTATC 
TATCAGCGGA AATACCGCCT GGGCACGCTG GATATTGTTT AA

Protein sequence

MMSKINQTDI DRLIELVGGR GNIATVSHCI TRLRFVLNQP ANARPKEIEQ LPMVKGCFTN 
AGQFQVVIGT NVGDYYQALI ASTGQAQVDK EQVKKAARQN MKWHEQLISH FAEIFFPLLP 
ALISGGLILG FRNVIGDLPM SNGQTLAQMY PSLQTIYDFL WLIGEAIFFY LPVGICWSAV 
KKMGGTPILG IVLGVTLVSP QLMNAYLLGQ QLPEVWDFGM FSIAKVGYQA QVIPALLAGL 
ALGVIETRLK RIVPDYLYLV VVPVCSLILA VFLAHALIGP FGRMIGDGVA FAVRHLMTGS 
FAPIGAALFG FLYAPLVITG VHQTTLAIDL QMIQSMGGTP VWPLIALSNI AQGSAVIGII 
ISSRKHNERE ISVPAAISAW LGVTEPAMYG INLKYRFPML CAMIGSGLAG LLCGLNGVMA 
NGIGVGGLPG ILSIQPSYWQ VFALAMVIAI IIPIVLTSFI YQRKYRLGTL DIV