Gene Mext_3469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3469
Symbol
ID	5831345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	3848189
End bp	3849373
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	70%
IMG OID	641369267
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001640925
Protein GI	163852882
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.753408
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCCA GTGAAGATAT CGTCATTGTC GGTGCGGCGC GTACGCCCGT CGGATCGTTC 
GCCGGTGCCT TCGGTTCCGT GCCGGCCCAC GAACTCGGCG CCACGGCGAT CAAGGCCGCA 
CTGGAGCGCG CGGGCGTTTC GCCGGACGAC GTGGACGAGG TGATCTTCGG CCAGGTGCTC 
ACCGCTGCCG CCGGGCAGAA CCCGGCCCGT CAGGCCGCCA TCGCCGCAGG CATCCCCGAG 
AAGGCGACCG CCTGGGGTCT CAATCAGGTC TGCGGCTCGG GCCTGCGCAC CGTCGCGGTC 
GGCATGCAGC AGATCGCCAA CGGCGACGCC AAGGTGATCG TGGCCGGCGG CCAGGAGTCG 
ATGTCGCTCA GCCCGCACGC CCAGTACCTG CGCGGCGGCC AGAAGATGGG CGATCTCAAG 
CTCGTCGACA CCATGATCAA GGACGGCCTG TGGGACGCCT TCAACGGCTA CCACATGGGC 
CAGACCGCCG AGAACGTCGC CCAGGCCTTC CAGCTCACCC GCGAGCAGCA GGACCAGTTC 
GCGGTTCGCT CGCAGAACAA GGCCGAGGCC GCCCGCAAGG AAGGCCGCTT CAAGGAAGAG 
ATCGTCCCCG TCACCGTGAA GGGCCGCAAG GGCGACACGG TCGTCGACAC CGACGAGTAC 
ATCCGCGACG GCGCCACCGT CGAGGCGATG GCCAAGCTCA AGCCCGCCTT CGCCAAGGAC 
GGCACCGTGA CCGCGGCCAA CGCCTCGGGC CTCAACGACG GCGCCGCCGC GCTGGTGCTG 
ATGTCGGCCT CCGAGGCCGA GCGCCGGGGC ATCACGCCGC TCGCCCGGAT CGTGTCCTGG 
GCGACCGCCG GCGTCGATCC CAAGGTGATG GGCACGGGCC CGATCCCGGC CTCGCGCAAG 
GCCCTGGAGA AGGCCGGCTG GAAGCCCGCC GACCTCGACC TGATCGAGGC GAACGAGGCT 
TTCGCCGCTC AGGCGCTGGC CGTGAACAAG GACATGGGCT GGGACGACGA GAAGGTGAAC 
GTCAATGGCG GCGCCATCGC CATCGGCCAC CCGATCGGTG CCTCCGGCGC CCGCGTCCTC 
ATCACCCTGC TGCACGAGCT GAAGCGCCGC GACGCCAAGA AGGGCCTCGC CACGCTCTGC 
ATCGGCGGCG GCATGGGTGT CGCCATGTGT GTCGAGCGGG TCTGA

Protein sequence

MAASEDIVIV GAARTPVGSF AGAFGSVPAH ELGATAIKAA LERAGVSPDD VDEVIFGQVL 
TAAAGQNPAR QAAIAAGIPE KATAWGLNQV CGSGLRTVAV GMQQIANGDA KVIVAGGQES 
MSLSPHAQYL RGGQKMGDLK LVDTMIKDGL WDAFNGYHMG QTAENVAQAF QLTREQQDQF 
AVRSQNKAEA ARKEGRFKEE IVPVTVKGRK GDTVVDTDEY IRDGATVEAM AKLKPAFAKD 
GTVTAANASG LNDGAAALVL MSASEAERRG ITPLARIVSW ATAGVDPKVM GTGPIPASRK 
ALEKAGWKPA DLDLIEANEA FAAQALAVNK DMGWDDEKVN VNGGAIAIGH PIGASGARVL 
ITLLHELKRR DAKKGLATLC IGGGMGVAMC VERV