Gene ECD_00743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00743
Symbol	bioF
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	794374
End bp	795528
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	58%
IMG OID
Product	8-amino-7-oxononanoate synthase
Protein accession	ACT42644
Protein GI	253976974
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000953076
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTGGC AGGATAAAAT CAACGCGGCC CTCGATGCGC GGCGTGCTGC CGATGCCCTG 
CGTCGCCGTT ATCCAGTGGC GCAAGGAGCA GGACGCTGGC TGGTGGCGGA CGATCGCCAG 
TATCTGAACT TTTCCAGTAA CGATTATTTA GGTTTAAGCC ATCATCCGCA AATTATCCGT 
GCCTGGAAGC AGAGTGCGGA GCAATTTGGC GTCGGTAGCG GCGGCTCCGG TCACGTCAGC 
GGTTATAGCG TGGCACATCA GGCGCTGGAA GAAGAACTGG CCGAGTGGCT GGGCTATTCG 
CGGGCACTGC TGTTTATCTC TGGTTTTGCC GCTAATCAGG CGGTCATTGC CGCGATGATG 
GCGAAAGAGG ACCGTATTGT TGCCGACCGG CTTAGCCATG CCTCATTGCT GGAGGCTGCC 
AGTTTAAGCC CGTCGCAGCT TCGCCGTTTT GTTCATAACG ATGTCACTCA TCTGGCGCGA 
CTGCTTGCTT CCCCCTGTCC GGGGCAGCAA ATGGTGGTGA CAGAAGGCGT GTTCAGCATG 
GACGGCGATA GTGCGCCACT GGCGGAAATC CAGCAGGTAA CGCAACAGCA CAATGGCTGG 
TTGATGGTCG ATGATGCCCA CGGCACGGGC GTTATCGGGG AGCAGGGGCG CGGCAGCTGC 
TGGCTGCAAA AGGTAAAACC AGAATTGCTG GTAGTGACTT TTGGCAAAGG ATTTGGCGTC 
AGCGGGGCAG CGGTGCTTTG CTCCAGTACG GTGGCGGATT ATCTGCTGCA ATTCGCCCGC 
CACCTTATCT ACAGCACCAG TATGCCGCCC GCTCAGGCGC AGGCATTACG TGCGTCGCTG 
GCGGTCATTC GCAGTGATGA GGGTGATGCA CGGCGCGAAA AACTGGCGGC ACTCATTACG 
CGTTTTCGTG CCGGAGTACA GGATTTGCCG TTTACGCTTG CTGATTCATG CAGCGCCATC 
CAGCCATTGA TTGTCGGTGA TAACAGCCGT GCGTTACAAC TGGCAGAAAA ACTGCGCCAG 
CAAGGCTGCT GGGTCACGGC GATTCGCCCG CCAACCGTAC CCGCTGGTAC TGCGCGACTG 
CGCTTAACGC TAACCGCTGC GCATGAAATG CAGGATATCG ACCGTCTGCT GGAGGTGCTG 
CATGGCAACG GTTAA

Protein sequence

MSWQDKINAA LDARRAADAL RRRYPVAQGA GRWLVADDRQ YLNFSSNDYL GLSHHPQIIR 
AWKQSAEQFG VGSGGSGHVS GYSVAHQALE EELAEWLGYS RALLFISGFA ANQAVIAAMM 
AKEDRIVADR LSHASLLEAA SLSPSQLRRF VHNDVTHLAR LLASPCPGQQ MVVTEGVFSM 
DGDSAPLAEI QQVTQQHNGW LMVDDAHGTG VIGEQGRGSC WLQKVKPELL VVTFGKGFGV 
SGAAVLCSST VADYLLQFAR HLIYSTSMPP AQAQALRASL AVIRSDEGDA RREKLAALIT 
RFRAGVQDLP FTLADSCSAI QPLIVGDNSR ALQLAEKLRQ QGCWVTAIRP PTVPAGTARL 
RLTLTAAHEM QDIDRLLEVL HGNG