Gene Gmet_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_2074
Symbol
ID	3739525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	-
Start bp	2333226
End bp	2334401
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	63%
IMG OID	637779368
Product	thiolase
Protein accession	YP_385028
Protein GI	78223281
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.000106789
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGACG TTTATGTAAT CGAATCGCTG CGCACTCCCC TCGGCTCCTT CGGGGGGGAG 
TTGTCCGACG TGGAGGCGCC GCGCCTGGCC GCCACCGTCA TCCGGGAACT GCTCCAGCGT 
TCCGGCCTTC CTGCCGAGGG CGTCGACGAG GTGATTGTCG GTCAGGTTCT CGCGGGCGGG 
ACGGGACAGG CCCCGGCCCG GCAGGCCATG CGCTACGCCG AACTCCCCGA CAGCATTCCC 
GCCATGACCA TCAACAAGGT CTGCGGCAGC GGCCTCAAGG CGCTCATGCT CGGCGCCGAT 
GCCATCCGCC TCGGTGATGT CGGCGTGGTG ATCGCCGGCG GCATGGAGAA CATGTCCCTG 
GCCCCCTATG TACTGAGCAA GGGGCGTAAC GGCTATCGTC TGGGTAACGG CGAGCTGATC 
GACCTCCTGG TAAATGACGG CCTCCTGGAT CCCTACAGCG GCAATCACAT GGGGGTAATC 
GCCGAGGCCA CCACGGAAAA GCACGGCATC TCCCGGGCAG ACCAGGATGC CTTTGCCTTC 
CGCTCCTACC AGAAAGCGCA GACAGCGGTT AAGGAAGGGA TATTCCGGGA TGAGATCGTC 
CCGGTGGTCA AAAAGGGGCG CAAGGGGGAC GTGACCGTCA GCGACGACGA AGAGCCATTC 
AAGGTGGACT TCACCAAACT CATGGGGTTG AAGAGCGCCT TCAAGAAGGA AGGGACCATC 
ACCGCCGGCA ACGCCTCAAC CATCAATGAT GGTGCGGCCC TGACCCTTCT GGCCAGTGGA 
GAGGCGGTGA AAAAATACGG TCTCAAGCCC AGGGCCCGAC TGGTCGCCTA TGCCTCCAAC 
AGCTTGCATC CCGACCAATT CACCGAGGCG CCGGTGGGAG CCATCGAAAA GGCCTGCGCC 
AAGGCCGGTC TGAAGCTCGA AGACATTGAT CTGTTCGAGA TCAACGAGGC CTTTGCCGCC 
GTGACCATGC TTGCCATCAA GCAACTGGGG CTCGATCCGG AAAAGGTCAA CGTCAACGGC 
GGGGCAGTGG CCATTGGCCA TCCCCTGGGG GCAAGCGGCG GACGTCTTGC CGCTACCCTG 
GTTCGGGAAC TGCACCGGCG CCAGGCCCGC TTCGGGCTCG CAACCCTCTG CATTGGGGGT 
GGTGAAGCAG TGGCGGCAAT CTTCGAGCGG GTCTGA

Protein sequence

MSDVYVIESL RTPLGSFGGE LSDVEAPRLA ATVIRELLQR SGLPAEGVDE VIVGQVLAGG 
TGQAPARQAM RYAELPDSIP AMTINKVCGS GLKALMLGAD AIRLGDVGVV IAGGMENMSL 
APYVLSKGRN GYRLGNGELI DLLVNDGLLD PYSGNHMGVI AEATTEKHGI SRADQDAFAF 
RSYQKAQTAV KEGIFRDEIV PVVKKGRKGD VTVSDDEEPF KVDFTKLMGL KSAFKKEGTI 
TAGNASTIND GAALTLLASG EAVKKYGLKP RARLVAYASN SLHPDQFTEA PVGAIEKACA 
KAGLKLEDID LFEINEAFAA VTMLAIKQLG LDPEKVNVNG GAVAIGHPLG ASGGRLAATL 
VRELHRRQAR FGLATLCIGG GEAVAAIFER V