Gene B21_02929 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02929
Symbol	yhaO
ID	8114009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3122183
End bp	3123451
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	50%
IMG OID	644849116
Product	hypothetical protein
Protein accession	YP_003000689
Protein GI	251786385
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0814] Amino acid permeases
TIGRFAM ID	[TIGR00814] serine transporter

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAGA GCGAGTGGCG AGAAGCGATC AAATTCGACA GTACTGACAC CGGCTGGGTG 
ATTATGAGTA TCGGGATGGC GATTGGCGCG GGGATTGTTT TTCTCCCGGT GCAGGTCGGT 
TTGATGGGAT TGTGGGTATT TTTGCTCTCA TCGGTGATTG GTTACCCGGC AATGTATCTG 
TTTCAGCGGT TGTTTATTAA TACGCTGGCA GAATCACCAG AATGTAAAGA TTACCCGAGT 
GTCATTAGCG GTTATTTAGG TAAAAACTGG GGCATCCTGT TAGGTGCGCT CTATTTCGTA 
ATGCTGGTGA TTTGGATGTT CGTCTATTCC ACCGCCATCA CCAACGATAG TGCTTCCTAC 
CTGCATACCT TCGGCGTGAC GGAAGGGTTG CTGTCAGACA GTCCCTTTTA TGGTCTGGTA 
CTGATTTGCA TTCTGGTGGC GATCTCCTCA CGCGGCGAGA AATTGTTATT CAAAATTTCG 
ACCGGCATGG TGCTGACCAA GCTGCTGGTG GTCGCGGCGC TGGGCGTGTC GATGGTGGGA 
ATGTGGCATC TGTATAACGT CGGTTCGCTA CCGCCGCTGG GGCTGCTGGT GAAAAACGCC 
ATTATTACGC TGCCGTTTAC CCTGACGTCG ATTCTGTTTA TTCAGACGTT AAGCCCGATG 
GTGATCTCTT ATCGCTCGCG GGAAAAATCC ATTGAAGTGG CGCGGCATAA AGCATTGCGG 
GCAATGAATA TCGCGTTTGG CATTTTGTTT GTCACCGTCT TTTTCTACGC CGTGTCGTTC 
ACGCTGGCGA TGGGACATGA CGAAGCGGTA AAAGCCTACG AGCAGAATAT TTCCGCGCTG 
GCGATTGCCG CACAGTTTAT TAGCGGTGAC GGCGCAGCGT GGGTGAAAGT GGTCAGCGTC 
ATTCTCAATA TCTTTGCTGT CATGACTGCA TTCTTTGGCG TCTATTTAGG CTTTCGCGAA 
GCAACGCAAG GGATCGTAAT GAACATCCTG CGTCGCAAGA TGCCTGCCGA GAAGATTAAC 
GAAAATCTTG TTCAGCGCGG CATCATGATT TTCGCCATTT TGCTGGCCTG GAGCGCCATC 
GTACTGAACG CACCGGTGTT GAGCTTCACC TCTATCTGTA GCCCGATTTT CGGCATGGTA 
GGGTGCCTGA TCCCGGCGTG GCTGGTTTAC AAAGTACCGG CATTGCACAA ATACAAAGGG 
ATGTCTCTGT ACCTGATTAT CGTCACTGGT TTGTTGCTTT GTGTTTCTCC GTTCCTGGCA 
TTTTCTTGA

Protein sequence

MSESEWREAI KFDSTDTGWV IMSIGMAIGA GIVFLPVQVG LMGLWVFLLS SVIGYPAMYL 
FQRLFINTLA ESPECKDYPS VISGYLGKNW GILLGALYFV MLVIWMFVYS TAITNDSASY 
LHTFGVTEGL LSDSPFYGLV LICILVAISS RGEKLLFKIS TGMVLTKLLV VAALGVSMVG 
MWHLYNVGSL PPLGLLVKNA IITLPFTLTS ILFIQTLSPM VISYRSREKS IEVARHKALR 
AMNIAFGILF VTVFFYAVSF TLAMGHDEAV KAYEQNISAL AIAAQFISGD GAAWVKVVSV 
ILNIFAVMTA FFGVYLGFRE ATQGIVMNIL RRKMPAEKIN ENLVQRGIMI FAILLAWSAI 
VLNAPVLSFT SICSPIFGMV GCLIPAWLVY KVPALHKYKG MSLYLIIVTG LLLCVSPFLA 
FS