Gene B21_04169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_04169
Symbol	yjiO
ID	8114991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	4474655
End bp	4475887
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	54%
IMG OID	644850312
Product	hypothetical protein
Protein accession	YP_003001885
Protein GI	251787581
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.596573
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACGTT TTTTTACCCG CCATGCCGCC ACGCTGTTTT TCCCGATGGC GTTGATTTTG 
TATGACTTTG CTGCGTATCT GTCGACGGAT CTGATCCAGC CTGGGATCAT TAATGTGGTA 
CGTGATTTTA ATGCCGATGT CAGTCTGGCC CCTGCTGCCG TCAGTCTCTA TCTTGCTGGC 
GGTATGGCGT TACAGTGGCT GCTGGGGCCG CTTTCCGACA GAATTGGCCG CAGGCCGGTG 
CTGATTACCG GGGCGCTAAT TTTTACCCTT GCCTGCGCCG CGACAATGTT CACAACGTCT 
ATGACACAGT TTCTTATCGC GCGTGCAATT CAGGGCACCA GTATCTGTTT TATTGCCACC 
GTTGGTTATG TCACGGTGCA GGAGGCGTTC GGACAGACAA AAGGGATCAA GTTGATGGCG 
ATTATCACCT CCATCGTACT GATTGCGCCG ATTATCGGCC CGCTTTCCGG CGCAGCTCTG 
ATGCACTTTA TGCACTGGAA AGTCCTTTTT GCCATCATTG CGGTTATGGG TTTTATCTCA 
TTTGTTGGCT TACTGTTGGC GATGCCAGAG ACGGTGAAGC GCGGCGCGGT TCCGTTTAGC 
GCCAAAAGCG TCTTGCGCGA TTTTCGTAAT GTCTTTTGCA ATCGGCTGTT CCTCTTTGGC 
GCAGCAACCA TCTCTTTAAG CTATATCCCG ATGATGAGCT GGGTGGCTGT CTCGCCGGTG 
ATCCTTATCG ATGCAGGCAG CTTAACAACT TCGCAGTTCG CCTGGACACA GGTTCCGGTG 
TTCGGCGCGG TGATTGTTGC GAATGCCATC GTGGCGCGTT TTGTTAAAGA TCCGACCGAA 
CCGCGGTTTA TCTGGCGTGC CGTACCCATT CAACTGGTCG GCCTCTCGCT GTTGATTGTC 
GGCAATCTGC TGTCGCCGCA CGTCTGGCTG TGGTCGGTGC TGGGCACCAG TCTGTATGCT 
TTCGGGATTG GTTTGATTTT CCCGACCTTA TTCCGCTTTA CGCTGTTTTC CAATAAGTTA 
CCGAAAGGGA CCGTCTCCGC ATCGCTAAAT ATGGTGATCC TGATGGTGAT GTCGGTCTCG 
GTCGAAATCG GCCGCTGGCT ATGGTTTAAC GGCGGTCGCT TGCCGTTTCA TCTGTTAGCC 
GTTGTGGCGG GCGTTATCGT CGTTTTCACC CTGGCGGGAT TGCTCAATCG CGTGCGCCAG 
CATCAGGCAG CCGAGCTAGT GGAGGAGCAG TGA

Protein sequence

MPRFFTRHAA TLFFPMALIL YDFAAYLSTD LIQPGIINVV RDFNADVSLA PAAVSLYLAG 
GMALQWLLGP LSDRIGRRPV LITGALIFTL ACAATMFTTS MTQFLIARAI QGTSICFIAT 
VGYVTVQEAF GQTKGIKLMA IITSIVLIAP IIGPLSGAAL MHFMHWKVLF AIIAVMGFIS 
FVGLLLAMPE TVKRGAVPFS AKSVLRDFRN VFCNRLFLFG AATISLSYIP MMSWVAVSPV 
ILIDAGSLTT SQFAWTQVPV FGAVIVANAI VARFVKDPTE PRFIWRAVPI QLVGLSLLIV 
GNLLSPHVWL WSVLGTSLYA FGIGLIFPTL FRFTLFSNKL PKGTVSASLN MVILMVMSVS 
VEIGRWLWFN GGRLPFHLLA VVAGVIVVFT LAGLLNRVRQ HQAAELVEEQ