Gene B21_03471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03471
Symbol	ybl163
ID	8116264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3706481
End bp	3707839
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	42%
IMG OID	644849643
Product	hypothetical protein
Protein accession	YP_003001216
Protein GI	251786912
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAACCC CGAGCTGCGT TGTCGCTCGA TCATTTATTA CATCCGGTGG GGTGATTATG 
AGTCAGGATA TAAATAATAA TATAGCTGTC AGCAAACACC GTCGAATAAT AAGACAACTA 
CGGTGGTGGA TGTTAATCCT TTTTCTAATG GGTGTCACTG TCAATTATAT TACCAGAAAC 
TCATTAGGTA TTTTGGCACC AGAGTTAAAA GACAGCCTTG GAATTACAAC TGAACAATAC 
TCCTGGATTG TTGGTGGATT TCAGCTTGCA TATACCCTTT TTCAGCCACT TTGTGGATGG 
CTAATTGATG TTATTGGGCT CAAGATTGGA TTTATGATTT GTGCTTCATT ATGGGGAATT 
GCTTGTCTTC TGCATGCAGG AGCAGGAAGC TGGATACAGC TTGCGTTGCT TCGTTTTTTC 
ATGGGAGGTG CTGAGGCTTC TGCGACACCT GCAAATGCAA AAATTATAGG TGAGTGGTTT 
CCAAAATCTG AACGTCCTGT TGCTGCTGGC TGGGCGGGTG TCGGTTTTTC TATCGGTGCA 
ATGCTTGCAC CACCAATTAT TTACTTTGCA CATGCGTCAT TTGGTTGGCA GGGTGCATTT 
ATGTTTACAG GTGCACTTGC AATTCTTTGG GTTTTCCTTT GGTGGGCGTG TTATAACACA 
CCAGAAGAGC ACCCAAACTT AAGTAAAAAT GAGCTCAACT TTATCCGACA GGATAACGAA 
GCTCCTCCGG TAAAAATGCC TTTTCTGACC GCGTTAAAAA CAGTTAGTAA AAATAAACGC 
TTTTATGGAA TCGCTATCCC TGCATTTATG GCAGAGCCAG CATGGGCTGT AATGAGCTTT 
TGGGTGCCAT TATATCTTGC AAAAGCATAT GGCATGGACC TTAAACAAAT AGCTCTGTTT 
GCATGGTTAC CATTTCTTTG CGCTGATTTA GGAAGTATTG CCAGCGGATA TCTGACAAAA 
CTCTATACCC GTCTGTTTGG GTTAAGCAGA GTAAATTCTG TTATTGCGTC CTCTGTAAGC 
GGAGCATTTC TAATGGTTTC GCTTGCTGTG ATTGCTTTTA TCGACAATCC ATATATTGCT 
ATTGTACTTA TCTCCATTGG TGGTTTTGGT CATCAGATAA TTTCCTGCAT GTTAAGTGCC 
CTGGTCGTTG AATCTTTTGA TAAGGGGCAG ATGGCCACTG TTAATGGAAT GCGTGGTTCA 
GCCGCATGGA TTGCCAGCTT TTTGTTCTCA CTGATTATTG GCGTTACTGC TGACAAAATA 
GGCTTTAACC CGCTATTTAT CGCCATGGGA TTTTTTGATC TTATTGGTGC TTTTTTTCTG 
GTTACTTTTA TTGCAGAACG TCGCAAAAAA CGCACCTGA

Protein sequence

MATPSCVVAR SFITSGGVIM SQDINNNIAV SKHRRIIRQL RWWMLILFLM GVTVNYITRN 
SLGILAPELK DSLGITTEQY SWIVGGFQLA YTLFQPLCGW LIDVIGLKIG FMICASLWGI 
ACLLHAGAGS WIQLALLRFF MGGAEASATP ANAKIIGEWF PKSERPVAAG WAGVGFSIGA 
MLAPPIIYFA HASFGWQGAF MFTGALAILW VFLWWACYNT PEEHPNLSKN ELNFIRQDNE 
APPVKMPFLT ALKTVSKNKR FYGIAIPAFM AEPAWAVMSF WVPLYLAKAY GMDLKQIALF 
AWLPFLCADL GSIASGYLTK LYTRLFGLSR VNSVIASSVS GAFLMVSLAV IAFIDNPYIA 
IVLISIGGFG HQIISCMLSA LVVESFDKGQ MATVNGMRGS AAWIASFLFS LIIGVTADKI 
GFNPLFIAMG FFDLIGAFFL VTFIAERRKK RT