Gene GM21_3708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3708
Symbol
ID	8139082
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4273775
End bp	4274830
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	60%
IMG OID	644871328
Product	thioesterase superfamily protein
Protein accession	YP_003023486
Protein GI	253702297
COG category	[I] Lipid transport and metabolism
COG ID	[COG1607] Acyl-CoA hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGATG AAACGACCAA AAATGAGGTG CTCCAACTGA CGCCGCACGA CACCCGATAC 
CTGTTCGTGC TCCCTTTCTC GACGGACCCG GCGCTGGCAC GGCGCTTTCT GGCACGAGAC 
CGCCAGATGC CGGGCAATAT CCGGTTTGGG AAACTTCTCG AGGTGCTGGA CAAGGTGGCC 
GAGAACACCG CGCTCGGGTA CGTGAACCAG TTCTATCCCG ACGCGCGGGT GGTGACCGCG 
GCCATCGACA ACATCGTGGT ACGAAACCCC GCGGACACCA CGCACGACCT GGTATTTTCA 
GCGCAGATAA ACCATGTGGG GAAATCGTCC ATGGAGGTGG GGATCAGGGT GGAATGTTTG 
GGGACCTGTT CAAACCACCT GGCGAGCTGC TACTTCACCA TGGTCGCCCG TTCGGCGGAC 
AGCAACGAGG CAAAGAGCCT CGCGCTTCCC CCTCTTGAGT ACAGGCAGCA GATAGAGCAG 
AAAAGACACC ACAAGGCGGA ACAGCGCCGC CAGGCGTACC GAGAGAGCCT GGCCAAAGCC 
GAGGAAATGC CTTCGCTCGA GGAGTACCTC TTCCTGAAGA AGCTGCATAA GGAGCAGGAA 
GCTCCAGACT TCGACGGCAT ACGCGCGGGG CAGCTGGCAC TGGAGTCAAC GGTCCGCGCC 
TACCCGGAGC AGGAGAACGT GCCAAAGACG ATCTTCGGGG GATACCTGAT GCGTAAAGCC 
TACGAACTGG CCGCGCTCGC AGCCGAGATG GTGACCGACG ACCGTGTGGT TCCCTGCCAG 
GTGAACCGGA TCAACTTCAA CCAGCCGGTG CTCCTCGGGG ACCAGTTGAA GTTCACGGCG 
CGGGTGGTCT TCACCGGAAA AACCACCATC ACGGTCCAGT CGGACATCCA ACGCTTCGAC 
CGCGACGCCC ACAACACCGC GCTTTCCAAT TCATGCCTCT TCACCTTTAG GAACGTCGGC 
AGCGAGATGG AACCCAAGCC GGTACCATTC ATCTACCCGG TCACCTACGC GGAAGACGCG 
AGATTCCTGA ACGCCTACCG GCAGCGGCTG GATTGA

Protein sequence

MSDETTKNEV LQLTPHDTRY LFVLPFSTDP ALARRFLARD RQMPGNIRFG KLLEVLDKVA 
ENTALGYVNQ FYPDARVVTA AIDNIVVRNP ADTTHDLVFS AQINHVGKSS MEVGIRVECL 
GTCSNHLASC YFTMVARSAD SNEAKSLALP PLEYRQQIEQ KRHHKAEQRR QAYRESLAKA 
EEMPSLEEYL FLKKLHKEQE APDFDGIRAG QLALESTVRA YPEQENVPKT IFGGYLMRKA 
YELAALAAEM VTDDRVVPCQ VNRINFNQPV LLGDQLKFTA RVVFTGKTTI TVQSDIQRFD 
RDAHNTALSN SCLFTFRNVG SEMEPKPVPF IYPVTYAEDA RFLNAYRQRL D