Gene B21_02454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02454
Symbol	aroF
ID	8113279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2605802
End bp	2606872
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	52%
IMG OID	644848654
Product	hypothetical protein
Protein accession	YP_003000227
Protein GI	251785923
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.538343
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAG ACGCGCTGAA TAACGTACAT ATTACCGACG AACAGGTTTT AATGACTCCG 
GAACAACTGA AGGCCGCTTT TCCATTGAGC CTGCAACAAG AAGCCCAGAT TGCTGACTCG 
CGTAAAACCA TTTCAGATAT TATCGCCGGG CGCGATCCTC GTCTGCTGGT AGTATGTGGT 
CCTTGTTCCA TTCATGATCC GGAAACTGCT CTGGAATATG CTCGTCGATT TAAAGCCCTT 
GCCGCAGAGG TCAGCGATAG CCTCTATCTG GTAATGCGCG TCTATTTTGA AAAACCCCGT 
ACCACTGTCG GCTGGAAAGG GTTAATTAAC GATCCCCATA TGGATGGCTC TTTTGATGTA 
GAAGCCGGGC TGCAGATCGC GCGTAAATTG CTGCTTGAGC TGGTGAATAT GGGACTGCCA 
CTGGCGACGG AAGCGTTAGA TCCGAATAGC CCGCAATACC TGGGCGATCT GTTTAGCTGG 
TCAGCAATTG GTGCTCGTAC AACGGAATCG CAAACTCACC GTGAAATGGC CTCCGGGCTT 
TCCATGCCGG TTGGTTTTAA AAACGGCACC GACGGCAGTC TGGCAACAGC AATTAACGCT 
ATGCGCGCCG CCGCCCAGCC GCACCGTTTT GTTGGCATTA ACCAGGCAGG GCAGGTTGCG 
TTGCTACAAA CTCAGGGGAA TCCGGACGGC CATGTGATCC TGCGCGGTGG TAAAGCGCCG 
AACTATAGCC CTGCGGATGT TGCGCAATGT GAAAAAGAGA TGGAACAGGC GGGACTGCGC 
CCGTCTCTGA TGGTAGATTG CAGCCACGGT AATTCCAATA AAGATTATCG CCGTCAGCCT 
GCGGTGGCAG AATCCGTGGT TGCTCAAATC AAAGATGGCA ATCGCTCAAT TATTGGTCTG 
ATGATCGAAA GTAATATCCA CGAGGGCAAT CAGTCTTCCG AGCAACCGCG CAGTGAAATG 
AAATACGGTG TATCCGTAAC CGATGCCTGC ATTAGCTGGG AAATGACCGA TGCCTTGCTG 
CGTGAAATTC ATCAGGATCT GAACGGGCAG CTGACGGCTC GCGTGGCTTA A

Protein sequence

MQKDALNNVH ITDEQVLMTP EQLKAAFPLS LQQEAQIADS RKTISDIIAG RDPRLLVVCG 
PCSIHDPETA LEYARRFKAL AAEVSDSLYL VMRVYFEKPR TTVGWKGLIN DPHMDGSFDV 
EAGLQIARKL LLELVNMGLP LATEALDPNS PQYLGDLFSW SAIGARTTES QTHREMASGL 
SMPVGFKNGT DGSLATAINA MRAAAQPHRF VGINQAGQVA LLQTQGNPDG HVILRGGKAP 
NYSPADVAQC EKEMEQAGLR PSLMVDCSHG NSNKDYRRQP AVAESVVAQI KDGNRSIIGL 
MIESNIHEGN QSSEQPRSEM KYGVSVTDAC ISWEMTDALL REIHQDLNGQ LTARVA