Gene B21_02110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02110
Symbol	atoB
ID	8113580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2215780
End bp	2216964
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	53%
IMG OID	644848318
Product	hypothetical protein
Protein accession	YP_002999891
Protein GI	251785587
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATT GTGTCATCGT CAGTGCGGTA CGTACTGCTA TCGGTAGTTT TAACGGTTCA 
CTCGCTTCCA CCAGCGCCAT CGACCTGGGG GCGACAGTAA TTAAAGCCGC CATTGAACGT 
GCAAAAATCG ATTCACAACA CGTTGATGAA GTGATTATGG GTAACGTGTT ACAAGCCGGG 
CTGGGGCAAA ATCCGGCGCG TCAGGCACTG TTAAAAAGCG GGCTGGCAGA AACGGTGTGC 
GGATTCACGG TCAATAAAGT ATGTGGTTCG GGTCTTAAAA GTGTGGCGCT TGCCGCCCAG 
GCCATTCAGG CAGGTCAGGC GCAGAGCATT GTGGCGGGGG GTATGGAAAA TATGAGTTTA 
GCCCCCTACT TACTCGATGC AAAAGCACGC TCTGGTTATC GTCTTGGAGA CGGACAGGTT 
TATGACGTAA TCCTGCGCGA TGGCCTGATG TGCGCCACCC ATGGTTATCA TATGGGGATT 
ACCGCCGAAA ACGTGGCTAA AGAGTACGGA ATTACCCGTG AAATGCAGGA TGAACTGGCG 
CTACATTCAC AGCGTAAAGC GGCAGCCGCA ATTGAGTCCG GTGCTTTTAC AGCCGAAATC 
GTCCCGGTAA ATGTTGTCAC TCGAAAGAAA ACCTTCGTCT TCAGTCAAGA CGAATTCCCG 
AAAGCGAATT CAACGGCTGA AGCGTTAGGT GCATTGCGCC CGGCCTTCGA TAAAGCAGGA 
ACAGTCACCG CTGGGAACGC GTCTGGTATT AACGACGGTG CTGCCGCTCT GGTGATTATG 
GAAGAATCTG CGGCGCTGGC AGCAGGCCTT ACCCCCCTGG CTCGCATTAA AAGTTATGCC 
AGCGGTGGCG TGCCCCCCGC ATTGATGGGT ATGGGGCCAG TACCTGCCAC GCAAAAAGCG 
TTACAACTGG CGGGGCTGCA ACTGGCGGAT ATTGATCTCA TTGAGGCTAA TGAAGCATTT 
GCTGCACAGT TCCTTGCCGT TGGGAAAAAC CTGGGCTTTG ATTCTGAGAA AGTGAATGTC 
AACGGCGGGG CCATCGCGCT CGGGCATCCT ATCGGTGCCA GTGGTGCTCG TATTCTGGTC 
ACACTATTAC ATGCCATGCA GGCACGCGAT AAAACGCTGG GGCTGGCAAC ACTGTGCATT 
GGCGGCGGTC AGGGAATTGC GATGGTGATT GAACGGTTGA ATTAA

Protein sequence

MKNCVIVSAV RTAIGSFNGS LASTSAIDLG ATVIKAAIER AKIDSQHVDE VIMGNVLQAG 
LGQNPARQAL LKSGLAETVC GFTVNKVCGS GLKSVALAAQ AIQAGQAQSI VAGGMENMSL 
APYLLDAKAR SGYRLGDGQV YDVILRDGLM CATHGYHMGI TAENVAKEYG ITREMQDELA 
LHSQRKAAAA IESGAFTAEI VPVNVVTRKK TFVFSQDEFP KANSTAEALG ALRPAFDKAG 
TVTAGNASGI NDGAAALVIM EESAALAAGL TPLARIKSYA SGGVPPALMG MGPVPATQKA 
LQLAGLQLAD IDLIEANEAF AAQFLAVGKN LGFDSEKVNV NGGAIALGHP IGASGARILV 
TLLHAMQARD KTLGLATLCI GGGQGIAMVI ERLN