Gene B21_02804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02804
Symbol	ybl135
ID	8116232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2994124
End bp	2995203
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	52%
IMG OID	644848993
Product	hypothetical protein
Protein accession	YP_003000566
Protein GI	251786262
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000115691
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTTT TCAGCCGCTA TTTAATCCGT CATCTCTTTC TCGGTTTTGC CGCCGCCGCA 
GGGCTATTGC TGCCGCTTTT TACCACCTTC AACCTGATTA ACGAACTGGA TGATGTCAGC 
CCGGGCGGTT ATCGCTGGAC TCAGGCGGTG CTGGTGGTGC TAATGACCTT ACCGCGCACA 
CTGGTCGAAC TTTCGCCATT TATCGCCTTA TTGGGAGGGA TTGTCGGCCT GGGGCAGTTA 
TCGAAAAACA GTGAGCTTAC CGCCATTCGC AGCATGGGGT TTTCTATCTT CCGTATTGCA 
CTGGTGGCGC TGGTTGCAGG GATATTGTGG ACTGTTTCGT TAGGCGCGAT AGATGAGTGG 
GTAGCGTCGC CATTACAGCA ACAGGCGTTG CAAATCAAAT CGACCGCCAC CGCGTTGGGG 
GAGGACGATG ACATTACCGG CAATATGCTG TGGGCCAGGC GTGGTAATGA ATTTGTGACG 
GTGAAATCGC TGAACGAGCA GGGCCAGCCG GTGGGCGTGG AGATTTTTCA TTATCGCGAC 
GATCTCTCGC TCGAATCCTA CATTTATGCA CGCAGTGCCA CCATTGAAGA CGACAAAACG 
TGGATCCTGC ATGGTGTGAA TCATAAAAAA TGGCTGAATG GCAAAGAAAC GCTGGAAACA 
TTAGATAATC TTGCCTGGCA ATCGGCCTTC ACCAGTATGG ATCTTGAAGA GTTATCAATG 
CCGGGCAATA CTTTTTCTGT CCGTCAGCTT AATCATTACA TCCATTATTT GCAGGAAACC 
GGGCAACCCA GCAGCGAATA CCGCCTTGCA CTGTGGGAAA AACTGGGGCA ACCCATCCTG 
ACCCTGGCGA TGATTTTGCT GGCTGTGCCG TTTACCTTTA GCGCCCCGCG CTCGCCAGGG 
ATGGGTAGCC GTCTCGCTGT AGGTGTCATC GTTGGCTTAC TCACCTGGAT CAGCTATCAA 
ATCATGGTCA ATCTGGGATT GCTATTTGCG TTGAGCGCAC CTGTTACCGC GCTCGGTTTA 
CCGATAGCGT TTGTGCTGGT GGCGTTGAGC CTGGTGTATT GGTATGACAG ACAACATTAA

Protein sequence

MNVFSRYLIR HLFLGFAAAA GLLLPLFTTF NLINELDDVS PGGYRWTQAV LVVLMTLPRT 
LVELSPFIAL LGGIVGLGQL SKNSELTAIR SMGFSIFRIA LVALVAGILW TVSLGAIDEW 
VASPLQQQAL QIKSTATALG EDDDITGNML WARRGNEFVT VKSLNEQGQP VGVEIFHYRD 
DLSLESYIYA RSATIEDDKT WILHGVNHKK WLNGKETLET LDNLAWQSAF TSMDLEELSM 
PGNTFSVRQL NHYIHYLQET GQPSSEYRLA LWEKLGQPIL TLAMILLAVP FTFSAPRSPG 
MGSRLAVGVI VGLLTWISYQ IMVNLGLLFA LSAPVTALGL PIAFVLVALS LVYWYDRQH