Gene Mlg_2110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2110
Symbol	fadI
ID	4270088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2394655
End bp	2395971
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	73%
IMG OID	638126866
Product	3-ketoacyl-CoA thiolase
Protein accession	YP_742942
Protein GI	114321259
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02446] fatty oxidation complex, beta subunit FadI

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.219559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACGC GAATCAACCC CGCGCCCAGT GAGCGTGGAC GGCGGGTGGC CATCGTCGCC 
GGCCTGCGCA CGCCCTTTGC CCGGCAGCTC ACCGCCTACC GCGAGCTCTC GGCCATCGAC 
CTGGGCATCC TGGTGACCGC CGAGCTGATG GCGCGCCTGG ACCTGGACCC GGCCCTGGTG 
GAGCGGGTGG TTTACGGGCA GGTGGGCATC CTGCCCCAGG CCCCCAACAT CGCCCGCGAG 
GTGGTGCTGG GCGCCGGCCT GCCGGCGGGC ACCGATGCCT ACAGCGTCTC CCGCGCCTGC 
GCCACCAGCT TCCAGTCCAC TGCCGAGGTG GCCACCGCCA TCGCCAACGG CGAGATCGAG 
ATCGGCCTGG CCGGTGGCGC CGACTCCACC TCGGTGCTAC CGCTGCAGCT CAGCCGGCCG 
TTGGCCCGGG CCCTGATTCA TGCCAGCAAG GCCCGCTCCC TGGGTGAACG CCTGCGCTGC 
CTCAGGGGCG TCCGGCCGCG GCACTTCATC CCCAGGCCAC CGGCGGTGAA GGATTACACC 
ACCGGCCTGG GGATGGGGGA TATCGCCGAG CAGATGGCCA GGAACCACGG CATCGGCCGC 
GAGGCCCAGG ACCGCTTCGC CCTCGACTCC CACCGCAAGG CCCACCAAGC CTGGGAGGAG 
GGGCGGCTGG CCGACGAGGT GATGCCGGCC ATCGTCCCGC CCTATAAAGA GGCGCTGGCG 
CGGGACAACA ACATCCGCGG GGACAGCAGC CCGGAGCAGC TCGCCCGGCT GCGCCCGGCC 
TTCGACCGGC GCCACGGCAC CGTGACCGCG GCCAACTCGA CGCCGCTCAC CGACGGCGCC 
AGCACCCTGC TGCTGATGCG CGAGGACCGG GCCCGGGCCC TGGGCCACAC CCCACTGGGC 
ACCCTGCGCA GCTGGGCCTT CACCGCCATC GACCCCTTCA ACGACGGCCT GATGGGGCCC 
TCCTACGCCA CCCCGCTGGC GCTGGACCGG GCCGGTGCGA CCCTGGACGA CATGGCACTG 
GTGGACATGC ACGAGGCCTT CGCCGCGCAG TCGCTGGCCA ACCTCAAGCA ATGGCCCAGC 
CGTCGCTTTG CCCGCGAGGC CCTCGGGCGA AACGCCCCCA TCGGCGAGGT GGACCCGGAG 
CGGTTCAACG TCCTGGGGGG CTCCATCGCC TACGGCCACC CCTTCGCCGC CACCGGCGGC 
CGGATGATCG TACAAACCCT GAATGAACTG CGCCGGCGCG GCGGCGGTCT CGCCCTGACC 
ACCGCCTGCG CCGCCGGCGG CCTGGGCGCC GCCATGGTGT TGGAGGTGGA CGGATGA

Protein sequence

MTTRINPAPS ERGRRVAIVA GLRTPFARQL TAYRELSAID LGILVTAELM ARLDLDPALV 
ERVVYGQVGI LPQAPNIARE VVLGAGLPAG TDAYSVSRAC ATSFQSTAEV ATAIANGEIE 
IGLAGGADST SVLPLQLSRP LARALIHASK ARSLGERLRC LRGVRPRHFI PRPPAVKDYT 
TGLGMGDIAE QMARNHGIGR EAQDRFALDS HRKAHQAWEE GRLADEVMPA IVPPYKEALA 
RDNNIRGDSS PEQLARLRPA FDRRHGTVTA ANSTPLTDGA STLLLMREDR ARALGHTPLG 
TLRSWAFTAI DPFNDGLMGP SYATPLALDR AGATLDDMAL VDMHEAFAAQ SLANLKQWPS 
RRFAREALGR NAPIGEVDPE RFNVLGGSIA YGHPFAATGG RMIVQTLNEL RRRGGGLALT 
TACAAGGLGA AMVLEVDG