Gene B21_02018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02018
Symbol	yehY
ID	8114681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2111576
End bp	2112733
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	58%
IMG OID	644848230
Product	hypothetical protein
Protein accession	YP_002999803
Protein GI	251785499
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1174] ABC-type proline/glycine betaine transport systems, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTTATT TCCGTATTAA TCCTGTTCTG GCGCTGCTGC TGTTGCTGAC GGCAATCGCA 
GCGGCGCTGC CGTTTATCAG TTACGCGCCT AATCGTTTAG TTTCGGGTGA GGGGCGTCAC 
CTCTGGCAGC TGTGGCCGCA AACGATCTGG ATGCTGGTGG GCGTTGGTTG CGCCTGGCTG 
ACGGCCTGTT TTATTCCCGG TAAAAAAGGC AGCATTTGTG CACTCATTCT GGCGCAATTC 
GTCTTCGTAT TGCTGGTGTG GGGAGCTGGA AAGGCGGCGA CCCAACTGGC GCAAAATGGC 
AGTGCGCTGG CGCGTACCAG CCTCGGCAGT GGTTTCTGGC TGGCTGCGGC GCTGGCATTG 
CTGGCCTGTA GCGATGCCAT CCGCCGAATC TCCACGCATC CGCTGTGGCG CTGGTTGTTG 
CATATGCAGA TTGCCATTAT TCCGCTGTGG TTGCTGTACT CCGGCACGCT TAACGATCTC 
TCACTAATGA AAGAATACGC CAACCGTCAG GATGTGTTTG ACGACGCGCT GGCACAACAT 
CTGACGTTGC TGTTTGGTGC GGTGCTGCCT GCGTTAGTGA TTGGTGTGCC GTTGGGCATC 
TGGTGCTACT TTTCCACTGC TCGGCAGGGG GCAATTTTTT CTCTGCTCAA TGTCATTCAG 
ACCGTGCCTT CGGTGGCGCT CTTTGGCCTG TTGATTGCGC CGCTTGCCGC GCTGGTGACG 
GCCTTTCCGT GGCTGGGGAA GCTCGGCATA GCAGGAACCG GAATGACACC CGCACTGATT 
GCGCTGGTGC TCTATGCCTT GCTGCCGCTG GTGCGCGGCG TGGTAGTCGG CTTGAACCAG 
ATCCCGCGCG ATGTGCTGGA GAGCGCCAGA GCGATGGGCA TGAGCGGGGC GCGGCGATTC 
CTGCATGTTC AGTTACCACT GGCGTTACCG GTATTTCTGC GCAGCCTGCG GGTGGTGATG 
GTGCAAACTG TAGGTATGGC GGTGATTGCG GCGTTAATCG GCGCAGGCGG TTTTGGTGCG 
CTGGTTTTCC AGGGGCTGCT AAGCAGCGCC ATTGATTTAG TGTTGCTGGG GGTGATCCCG 
GTAATTGTTC TGGCGGTGCT TACCGACGCG CTGTTCGATT TGCTTATCGC ACTGCTGAAG 
GTGAAACGTA ATGATTGA

Protein sequence

MTYFRINPVL ALLLLLTAIA AALPFISYAP NRLVSGEGRH LWQLWPQTIW MLVGVGCAWL 
TACFIPGKKG SICALILAQF VFVLLVWGAG KAATQLAQNG SALARTSLGS GFWLAAALAL 
LACSDAIRRI STHPLWRWLL HMQIAIIPLW LLYSGTLNDL SLMKEYANRQ DVFDDALAQH 
LTLLFGAVLP ALVIGVPLGI WCYFSTARQG AIFSLLNVIQ TVPSVALFGL LIAPLAALVT 
AFPWLGKLGI AGTGMTPALI ALVLYALLPL VRGVVVGLNQ IPRDVLESAR AMGMSGARRF 
LHVQLPLALP VFLRSLRVVM VQTVGMAVIA ALIGAGGFGA LVFQGLLSSA IDLVLLGVIP 
VIVLAVLTDA LFDLLIALLK VKRND