Gene B21_03508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03508
Symbol	ybl173
ID	8114902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3747618
End bp	3748940
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	53%
IMG OID	644849679
Product	hypothetical protein
Protein accession	YP_003001252
Protein GI	251786948
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAAAT TCTCAGTGGT TGTCGCAGGC GGTGGAAGCA CCTTTACGCC AGGCATCGTG 
TTGATGCTCT TGGCGAATCA GGACCGTTTC CCGCTTCGTG CACTGAAATT TTATGATAAC 
GATGGTGCGC GGCAGGAAGT GATTGCCGAA GCCTGTAAAG TCATCCTTAA AGAAAAAGCG 
CCGGACATTG CGTTTAGTTA CACCACCGAT CCTGAAGTAG CGTTCAGCGA CGTTGATTTT 
GTTATGGCGC ACATCCGCGT CGGCAAATAC CCGATGCGCG AACTGGATGA AAAAATCCCG 
CTGCGCCACG GCGTTGTTGG TCAGGAAACT TGCGGACCCG GCGGAATAGC GTACGGCATG 
CGTTCCATTG GTGGCGTCCT GGAACTGGTG GATTATATGG AAAAATATTC ACCAAATGCC 
TGGATGCTCA ACTACTCCAA CCCGGCAGCC ATTGTCGCAG AAGCCACGCG TCGTCTGCGC 
CCGAATGCGA AAATCCTCAA CATCTGTGAC ATGCCAATCG GTATTGAAAG CCGGATGGCG 
CAAATTGTTG GGCTGCAAGA TCGCAAACAG ATGCGCGTGC GCTACTACGG CCTGAACCAC 
TTTGGCTGGT GGACATCAAT TGAAGATTTG CAGGGCAACG ACCTGATGCC CCAGCTGCGG 
CAATATGTCT CTAAGCATGG TTATGTTCCA CCGCAGCAAG ATACGCATAC TGAAGCGAGC 
TGGAACGACA CCTATGCAAA AGCGCGGGAT GTCCAGGCAC TGGCCCCGGA TACATTACCA 
AACACCTATC TGAAATATTA TCTCTTCCCG GATTACGTCG TTCAGCATTC CAACCCTGAA 
CATACCCGCG CGAATGAGGT GATGGAACAT CGCGAGAAAC AGGTTTTCGA TGCTTGCCGC 
GCCATTACGG CGGCAGGAAA TTCAGCGGCG GGCAAGCTGG AAATTGACGA ACATGCGTCA 
TACATCGTCG ATCTGGCGGC GGCAATTGCC TTCAACACTC AGGAGCGGAT GTTGCTGATT 
GTGCCTAACA ACGGGGCAAT TCATAACTTT GATGATGAAG CGATGGTCGA GATCCCGTGT 
CTGGTTGGGC ACAACGGACC AGAACCACTG GTGGTCGGCG ATATCCCGCA GTTTCAGAAA 
GGGTTAATGA GTCAGCAAGT GGCGGTGGAA AAACTGGTCG TGGACGCCTG GGAACAGCGT 
TCATATCAGC ACCTGTGGCA GGCGATTACG TTGTCGAAAA CGGTACCGAG CGCCTCGGTC 
GCCAAAGCTA TTCTGGATGA ATTGCTGGAG GCCAACAAAG CGTACTGGCC AGAGTTACGT 
TAA

Protein sequence

MTKFSVVVAG GGSTFTPGIV LMLLANQDRF PLRALKFYDN DGARQEVIAE ACKVILKEKA 
PDIAFSYTTD PEVAFSDVDF VMAHIRVGKY PMRELDEKIP LRHGVVGQET CGPGGIAYGM 
RSIGGVLELV DYMEKYSPNA WMLNYSNPAA IVAEATRRLR PNAKILNICD MPIGIESRMA 
QIVGLQDRKQ MRVRYYGLNH FGWWTSIEDL QGNDLMPQLR QYVSKHGYVP PQQDTHTEAS 
WNDTYAKARD VQALAPDTLP NTYLKYYLFP DYVVQHSNPE HTRANEVMEH REKQVFDACR 
AITAAGNSAA GKLEIDEHAS YIVDLAAAIA FNTQERMLLI VPNNGAIHNF DDEAMVEIPC 
LVGHNGPEPL VVGDIPQFQK GLMSQQVAVE KLVVDAWEQR SYQHLWQAIT LSKTVPSASV 
AKAILDELLE ANKAYWPELR