Gene B21_01662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01662
Symbol	aroH
ID	8113812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	1732166
End bp	1733212
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	53%
IMG OID	644847886
Product	hypothetical protein
Protein accession	YP_002999459
Protein GI	251785155
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.114044
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGAA CTGACGAACT CCGTACTGCG CGTATTGAGA GCCTGGTAAC GCCCGCCGAA 
CTCGCGCTAC GGTATCCCGT AACGCCTGGC GTCGCCACCC ATGTCACCGA CTCCCGCCGC 
AGAATTGAAA AAATACTCAA TGGTGAAGAT AAGCGACTGT TGGTCATTAT TGGCCCCTGC 
TCGATCCACG ATCTCACCGC TGCAATGGAG TACGCCACCC GTCTGCAGTC GCTGCGCAAC 
CAGTACCAGT CACGGCTGGA AATCGTAATG CGCACCTATT TTGAAAAACC ACGAACTGTT 
GTCGGCTGGA AAGGACTAAT CTCCGATCCA GATTTAAACG GCAGCTATCG GGTAAATCAC 
GGTCTGGAGC TGGCGCGCAA ATTACTTTTA CAGGTAAATG AGCTGGGCGT CCCAACCGCG 
ACTGAGTTCC TCGATATGGT GACCGGTCAG TTTATTGCTG ATTTAATCAG TTGGGGCGCG 
ATTGGCGCAC GTACTACCGA AAGTCAGATC CACCGCGAAA TGGCTTCGGC ACTCTCCTGT 
CCGGTAGGTT TTAAAAATGG TACCGATGGC AATACGCGGA TTGCTGTGGA TGCTATCCGC 
GCAGCCCGCG CCAGCCATAT GTTCCTCTCG CCAGACAAAA ATGGTCAGAT GACCATCTAT 
CAGACCAGCG GCAACCCGTA TGGCCACATT ATTATGCGTG GCGGCAAAAA ACCGAATTAT 
CATGCCGATG ATATCGCCGC AGCCTGCGAT ACGCTGCACG AGTTTGATTT ACCTGAACAT 
CTGGTGGTGG ATTTCAGCCA CGGTAACTGC CAGAAGCAGC ACCGTCGCCA GTTAGAAGTT 
TGTGAGGATA TTTGTCAGCA AATCCGCAAT GGCTCTACGG CGATTGCTGG AATTATGGCG 
GAAAGTTTCC TGCGCGAAGG AACGCAAAAA ATCGTCGGCA GTCAGCCGCT CACTTACGGT 
CAATCCATTA CCGACCCGTG TCTGGGCTGG GAGGATACCG AACGCCTGGT CGAAAAACTC 
GCCTCTGCGG TAGATACCCG CTTCTGA

Protein sequence

MNRTDELRTA RIESLVTPAE LALRYPVTPG VATHVTDSRR RIEKILNGED KRLLVIIGPC 
SIHDLTAAME YATRLQSLRN QYQSRLEIVM RTYFEKPRTV VGWKGLISDP DLNGSYRVNH 
GLELARKLLL QVNELGVPTA TEFLDMVTGQ FIADLISWGA IGARTTESQI HREMASALSC 
PVGFKNGTDG NTRIAVDAIR AARASHMFLS PDKNGQMTIY QTSGNPYGHI IMRGGKKPNY 
HADDIAAACD TLHEFDLPEH LVVDFSHGNC QKQHRRQLEV CEDICQQIRN GSTAIAGIMA 
ESFLREGTQK IVGSQPLTYG QSITDPCLGW EDTERLVEKL ASAVDTRF