Gene GM21_0842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0842
Symbol
ID	8136158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	997878
End bp	999527
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	64%
IMG OID	644868454
Product	Acetyl-CoA hydrolase
Protein accession	YP_003020668
Protein GI	253699479
COG category	[C] Energy production and conversion
COG ID	[COG0427] Acetyl-CoA hydrolase
TIGRFAM ID	[TIGR03458] succinate CoA transferases

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	116
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAATT ATGGAACCCT GCAGGACCGC GTGCGCTGCA AGTCGCTTCT GAACAAAGTG 
ATGTCCCCCG AACAGACCAT CGGCTTCTTC AAGGACGGGA TGAACCTGGG CTGGTCCGGT 
TTCACCCCGG CCGGCTACCC AAAAGCGGTG CCCATCGCCC TGGCGGACCA CGTCGAGAAG 
AACGGGCTGC AAGGCAAACT CAGGTTCAAC CTCTTCATCG GCGCCTCGGT CGGAGCGGAA 
ACCGAAGACC GTTGGGCGAC CCTCGACATG ATCGACCGCC GCTGGCCCTA CCAGACCGGC 
AAGAACATCG CCGCGGGGAT CAACGCCGGC CGCATCCGCA TGGGGGACAA GCACCTCTCC 
CTGTTCGCCC AGGATCTCGG CTACGGCTTC TACACCAAGG ACACCCCGAG CGGCAAGCTC 
GACCTCGCCA TCATCGAGGT CTCGGCCATC ACCGAAGACG GTGGGCTGGT GCTGACCTCT 
TCCTGCGGCG TCGTCCCCGA AATCCTGATG ATCTGCGACA AGATCATCCT CGAGGTGAAC 
ACCGGACAGC CCTCCTTCGA GGGGATGCAC GACGTCGTGG TCTGCAATCA CCCCCCCAAG 
CGCCAGATCC TGGGGATCAC CAGCGCCGGC GAGCGCATCG GCAGCACCTA CGTCCCGTGC 
GACCCCAGCA AGGTGATCGC CGTGGTCGAG TCCAAGCACC GCGACAAGGG GCGCGCCTTC 
TCCGAGCAGG ACGACACCTC CGAGGCGATC GCCAATAACA TCATCGACTT CTTCAGCCAC 
GAGGTGAAGG CGGGGCGCCT GCCCAAGAAC CTCCTCCCGC TGCAGTCCGG CGTAGGTTCC 
ATCGCCAACG CCGTCATCGG CGGCCTGGCC AAGGGTCCCT TCTCGAACCT CACCGTCTAC 
ACCGAGGTGC TGCAGGACAC CATGCTCGAC CTCTTTGACT CGGGCAAGCT GGACATGGCG 
TCTTCCTGCT CCCTGTCGCT CTCAGAGACC CCGGGCTTCC CGCGTTTCTT CGACAACATG 
GAGAAGTACT TCGACAAGAT CGTGCTGCGC CCGCTCTCCA TCTCCAACGC CCCCGAGCCG 
ATCCGTCGCC TTGGGTGCAT CGCGATGAAC ACCCCGGTCG AGATCGACAT CTACGCGCAC 
GCCAACTCGA CGCTTGTCGG CGGCACCCGC ATGATCAACG GCCTGGGCGG CTCGGGCGAC 
TTCCTGAGGA ACGGGTTCCT GAAGATCATG CACACCCCGT CCTCCCGCCC CTCGAAGACC 
GATCCCAACG GCATCTCCTG CGTGGTGCCG CACTGCTCGC ACATCGACCA CACCGAGCAC 
GACCTCGACT GCGTGGTTAC CGAGCAGGGG CTTGCCGACC TGCGCGGCAT GGCTCCCAAG 
GAGCGCGCCC GCCGCATCAT CGAGAAGTGC GCGCACCCCG ACTACAAGCC GATCCTCACC 
GAGTACCTCA ACATCGCCGA GAAGCAGTGC CTCGCGAAGA ATGTCGGCCA CGAGCCGCAG 
CTTTGGGACC GCGCCTTCAA GATGCACCTG AACCTCGCCG CGAACGGTAC CATGAAGATC 
AAGAACTGGG ACATGAAGGT CGACCTCTGC GACGAGGTAG CCGAGCGCCC GGTGCGCCAG 
CCGAGCGTAG GCGACTCCGC CGCGGTTTAG

Protein sequence

MSNYGTLQDR VRCKSLLNKV MSPEQTIGFF KDGMNLGWSG FTPAGYPKAV PIALADHVEK 
NGLQGKLRFN LFIGASVGAE TEDRWATLDM IDRRWPYQTG KNIAAGINAG RIRMGDKHLS 
LFAQDLGYGF YTKDTPSGKL DLAIIEVSAI TEDGGLVLTS SCGVVPEILM ICDKIILEVN 
TGQPSFEGMH DVVVCNHPPK RQILGITSAG ERIGSTYVPC DPSKVIAVVE SKHRDKGRAF 
SEQDDTSEAI ANNIIDFFSH EVKAGRLPKN LLPLQSGVGS IANAVIGGLA KGPFSNLTVY 
TEVLQDTMLD LFDSGKLDMA SSCSLSLSET PGFPRFFDNM EKYFDKIVLR PLSISNAPEP 
IRRLGCIAMN TPVEIDIYAH ANSTLVGGTR MINGLGGSGD FLRNGFLKIM HTPSSRPSKT 
DPNGISCVVP HCSHIDHTEH DLDCVVTEQG LADLRGMAPK ERARRIIEKC AHPDYKPILT 
EYLNIAEKQC LAKNVGHEPQ LWDRAFKMHL NLAANGTMKI KNWDMKVDLC DEVAERPVRQ 
PSVGDSAAV