Gene Gmet_2058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_2058
Symbol
ID	3738652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	-
Start bp	2312207
End bp	2313406
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	61%
IMG OID	637779352
Product	thiolase
Protein accession	YP_385012
Protein GI	78223265
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.35513
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.039203
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGAAG CAGTAATTGT CGATGCTGTC CGTACTCCGG TGGGAAAATT CAACGGCGCC 
CTGAAAAACG TCCGCTCTGA CGACCTGGCC GCCCACTGTA TTTCCGAACT GGTGAAGCGT 
AACAATCTTG ATCCGAACCT GGTCGAAGAT GTGGTGCTCG GTTGCACCAA CCAGGCGGGC 
GAGGACAACC GGAACGTCGG CCGGATGGCG GCGCTTCTGG CCGGTCTGCC GTATTCGGTC 
GCGGGGCAGA CCATCAACCG TCTCTGTGCC TCGGGCCTGA ATGCCATCAA CAGCGCAGCC 
CATGCGATTA AACTCGGCGA AGGTGATGTC TTTATCGCTG GCGGTACCGA ATCCATGACC 
CGTGCCCCCT TTGTCATGGC CAAGTCCGAA TCCCCTTTCT CGCGCGATAT CAGGGTGTTT 
GACAGCGTCA TCGGCTGGCG GTTCACCAAC CCGAAGATGA CTGAACCATA TGCCAAGGAA 
GGAATGGGCG AAACCGCCGA GAACGTGGCG GTGCGGTATG GCCTCACCCG CCAGGAGCAG 
GACGAGTTTG CCCTGGAGAC CCAACGCAAA TGGGCTGCCG CCGATGCGGC CGGCAAGTTC 
AATGACGAGA TCGTTCCCGT CGTTATCCCC CAGAAGAAGG GGGATCCGAT CATCGTCTCC 
AGGGATGAAT TCCCTCGCGG CAACGATGTC ACCATGGAGC AGCTTGCCAA GCTGCCGGCT 
GCCTTCAGAA AGGAGGGCAC CGTCACCGCC GGCAACTCCA GCGGCATCAA CGACGGCGCC 
GCAGCGCTCC TCCTCATGGA GGCAGAAACC GCCAAGAAGC TCGGCTACAA GCCGCTTGCC 
AGGGTCGTCG CCAGTGCGGT TGCCGGTTGC GATCCCTCGT ACATGGGGCT CGGCCCCATC 
CCGGCGATCC AGAAGGTGCT GCAACGGTCC GGCCTGAAAA TCGAAGATAT TGACCTCTTC 
GAGCTGAACG AGGCCTTTGC CGCCCAGTCC ATCCCCTGCA TCCGCGAACT GGGGATCGAT 
CCGGCCAAGG TGAACGTCAA CGGCGGCTCC ATCGCCATCG GCCACCCCCT CGGCTCCACC 
GGCGCCCGGA TCACCGCCAC GCTGGTCCAT GAGATGAAGC GCCGTGGCTC CCGCTACGGT 
CTCGTGTCCC TCTGTATCGG TGTCGGACAG GGAATTGCGA CGATCTTCGA ACGCGTGTAA

Protein sequence

MREAVIVDAV RTPVGKFNGA LKNVRSDDLA AHCISELVKR NNLDPNLVED VVLGCTNQAG 
EDNRNVGRMA ALLAGLPYSV AGQTINRLCA SGLNAINSAA HAIKLGEGDV FIAGGTESMT 
RAPFVMAKSE SPFSRDIRVF DSVIGWRFTN PKMTEPYAKE GMGETAENVA VRYGLTRQEQ 
DEFALETQRK WAAADAAGKF NDEIVPVVIP QKKGDPIIVS RDEFPRGNDV TMEQLAKLPA 
AFRKEGTVTA GNSSGINDGA AALLLMEAET AKKLGYKPLA RVVASAVAGC DPSYMGLGPI 
PAIQKVLQRS GLKIEDIDLF ELNEAFAAQS IPCIRELGID PAKVNVNGGS IAIGHPLGST 
GARITATLVH EMKRRGSRYG LVSLCIGVGQ GIATIFERV