Gene B21_03079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03079
Symbol	yhdY
ID	8114045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3281692
End bp	3282795
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	52%
IMG OID	644849262
Product	hypothetical protein
Protein accession	YP_003000835
Protein GI	251786531
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0765] ABC-type amino acid transport system, permease component
TIGRFAM ID	[TIGR01726] amine acid ABC transporter, permease protein, 3-TM region, His/Glu/Gln/Arg/opine family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAG TATTGCTGTC TCATCCCCCG CGCCCGGCGA GCCATAACTC AAACCGCGCG 
ATGGTGTGGG TGCGAAAAAA TCTGTTCTCC AGCTGGAGCA ATAGCCTGCT GACTATTGGC 
TGCATATGGT TGATGTGGGA ACTGATCCCA CCGTTGCTGA ACTGGGCATT TTTGCAGGCT 
AACTGGGTTG GCTCAACGCG TGCCGACTGC ACAAAAGCCG GTGCCTGTTG GGTCTTCATC 
CACGAACGAT TTGGTCAGTT TATGTATGGG CTTTACCCAC ACGACCAACG CTGGCGAATT 
AACCTCGCAT TACTGATTGG GCTTGTGTCG ATCGCACCAA TGTTCTGGAA AATACTCCCG 
CATCGCGGTC GCTATATTGC GGCCTGGGCG GTGATTTACC CACTGATTGT CTGGTGGCTG 
ATGTATGGCG GTTTTTTTGC TCTTGAGCGG GTTGAAACCC GGCAATGGGG CGGGCTGACG 
CTAACTTTAA TTATTGCATC AGTTGGGATT GCGGGGGCGC TACCGTGGGG GATCTTACTG 
GCGTTAGGTC GCCGCTCCCA TATGCCGATT GTGCGTATCT TATCGGTCAT TTTTATCGAG 
TTCTGGCGCG GCGTACCGTT GATTACCGTA TTGTTTATGT CTTCGGTCAT GCTGCCGTTG 
TTTATGGCAG AAGGCACCAG TATCGACAAA CTGATCCGCG CGCTGGTTGG CGTGATCCTG 
TTTCAGTCAG CATATGTTGC GGAAGTCGTG CGAGGCGGAT TACAGGCACT GCCTAAAGGG 
CAGTATGAAG CGGCAGAGTC GCTGGCGTTG GGTTACTGGA AAACTCAGGG GCTGGTTATT 
CTGCCACAGG CGTTGAAGCT GGTAATTCCT GGGCTGGTAA ATACCATCAT CGCACTCTTC 
AAAGATACCA GCCTGGTGAT CATTATCGGG TTGTTCGATC TTTTCAGTAG CGTTCAGCAG 
GCAACCGTTG ATCCCGCCTG GTTGGGTATG TCGACGGAAG GGTATGTTTT CGCCGCGCTG 
ATCTACTGGA TCTTCTGTTT CAGCATGTCG CGCTATAGCC AGCATCTGGA AAAACGTTTT 
AACACCGGGC GTACACCGCA TTGA

Protein sequence

MTKVLLSHPP RPASHNSNRA MVWVRKNLFS SWSNSLLTIG CIWLMWELIP PLLNWAFLQA 
NWVGSTRADC TKAGACWVFI HERFGQFMYG LYPHDQRWRI NLALLIGLVS IAPMFWKILP 
HRGRYIAAWA VIYPLIVWWL MYGGFFALER VETRQWGGLT LTLIIASVGI AGALPWGILL 
ALGRRSHMPI VRILSVIFIE FWRGVPLITV LFMSSVMLPL FMAEGTSIDK LIRALVGVIL 
FQSAYVAEVV RGGLQALPKG QYEAAESLAL GYWKTQGLVI LPQALKLVIP GLVNTIIALF 
KDTSLVIIIG LFDLFSSVQQ ATVDPAWLGM STEGYVFAAL IYWIFCFSMS RYSQHLEKRF 
NTGRTPH