Gene GM21_1579 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1579
Symbol
ID	8136910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1842180
End bp	1844021
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	65%
IMG OID	644869192
Product	UbiD family decarboxylase
Protein accession	YP_003021392
Protein GI	253700203
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGATATA AGAATCTGGC AGCGTGCGTG ACGGACCTGG AGCGGACCGG CGCACTGGTA 
AGGATAAACG AGGAACTCTC TTCTGACCTG GAGATCGGGT CCATCCAGCG CAGGGTGTAC 
CAGGCGGGTG GCCCGGCGCT TCTCTTTACC CGGGTGAAGG GATGCTCTTT CCCGATGCTC 
GGGAACCTGT TCGGGACCCT GGAGCGGACC AGGTACATCT TCAGGGATAC CCTGAGGGCG 
GTCGAGCGTC TGGTGCAGTT GAAGATCGAT CCGAAATCGG CACTGAAAGA CCCCGCTTCC 
TTTTTGGCGG CGGTCCCGGC CGCATGGCAC CTCATTCCCA AGGAGGTGGG GGACGGCCCC 
ATCCTCGCCA ACCGGACCAC CATCGATAAA CTGCCGCAGC TAAAATCCTG GCCGGACGAC 
GGCGGCGCCT TCATCACGCT GCCGCAGGTC TACTCGGAGA GCGTGGCCCA ACCGGGATTG 
CGCCACTCCA ACCTCGGCAT GTACCGGGTG CAGATCTCCG GCGGCGAGTA CCGGCAAAAC 
GCTGAGGTGG GGGTGCACTA CCAGATCCAT CGCGGCATCG GCTTTCACCA TGCGGAGGCG 
ATCGAGCGGG GCGAGCCGTT GCGGGTGAAC ATCTTCGTGG GGGGCGCACC CTCCATGACT 
GTCGCCGCCG TGATGCCCTT GCCCGAGGGG ATGCCGGAAC TCTCTTTCGC CGGGCTTCTG 
GCCGGGCACC GGATCGAGAT GGTGCAGCGC CCCGGGCAGC TCCCGATTCC CGCGCAGGCC 
GACTTCTGCA TCACCGGCGT CATCGACCCC AACAAGACCC TTCCCGAAGG CCCCTTCGGC 
GACCATTTCG GCTACTACAG CCTGGCGCAC CACTTCCCCG TGCTCCAGGT CGAGGAGGTC 
TTCCATCGCG ACGGCGCCAT CTGGCCCTTC ACCACTGTGG GGCGCCCTCC GCAGGAGGAT 
ACCTCCTTCG GCGCCTTCAT TCATGAACTG ACCGGTCCCT TGATCCCCAC GGTGATACCG 
GGCGTCAAGG CGGTGCACGC GGTGGACGCG GCCGGAGTGC ACCCGCTGCT TTTGGCCTTG 
GGTAGCGAGC GCTACGTCCC CTACGGCGAG CGCCGGACTC CGCAGGAACT CCTCACCATC 
GCGAACGCGG TGCTCGGACA GGGGCAGCTC TCCCTGGCCA AGTACCTGAT GATCGCCTCC 
CACGAGGACG CGCCGCAGCT CGACATCCAC GACATCCCCG CCTTCCTGCG CCATGTGCTG 
GAGCGGATCG ACCTGAAGCG CGATCTGCAT TTCCAGACCG CCACCACCAT CGACACGCTC 
GATTACTCCG GCTCAGGGCT GAACAGCGGC TCCAAGGTGG TGTTCGCCGC CGTCGGCGAA 
AAGCGCCGCA CCCTCGGGGT CGAACTCCCC TCCTCGTTGA GCCTGGCCGA CGGCTTCAAT 
GATCCCTGTA TTTGCCTCCC CGGCGTCATC GCGGTCAAGG GGCCTGCCTG CACCGTCCGG 
AAGGGGGAGG CGGACCCGCA GATGGAGGCG CTTTGCGCTG CGCTCGAGGG AGTGGAGGGG 
CTGGAGAGTT TCCCGCTGAT CGTCGTCTGC GACGACAGCA GGTTCGCCGC AAAAGATCTG 
GACAACTTCC TCTGGGTCAC CTTCACCCGT TCCGATCCCG CCGCCGACAT CTACGGTGTC 
GGGGCCGGCA TGGTTTGCAA GCAGTGGGGG TGCACAGGTC CCCTGGTGAT AGACGCCCGG 
GTCAAGCCGC ACCACGCGCC GCCGCTCATC GAGGATCCGG CCGTCGAGCG GAAGCTGGAC 
CAGTTGGCCG CCCCAGGAGG GCCGCTGCAC GGGTTGTATT AG

Protein sequence

MGYKNLAACV TDLERTGALV RINEELSSDL EIGSIQRRVY QAGGPALLFT RVKGCSFPML 
GNLFGTLERT RYIFRDTLRA VERLVQLKID PKSALKDPAS FLAAVPAAWH LIPKEVGDGP 
ILANRTTIDK LPQLKSWPDD GGAFITLPQV YSESVAQPGL RHSNLGMYRV QISGGEYRQN 
AEVGVHYQIH RGIGFHHAEA IERGEPLRVN IFVGGAPSMT VAAVMPLPEG MPELSFAGLL 
AGHRIEMVQR PGQLPIPAQA DFCITGVIDP NKTLPEGPFG DHFGYYSLAH HFPVLQVEEV 
FHRDGAIWPF TTVGRPPQED TSFGAFIHEL TGPLIPTVIP GVKAVHAVDA AGVHPLLLAL 
GSERYVPYGE RRTPQELLTI ANAVLGQGQL SLAKYLMIAS HEDAPQLDIH DIPAFLRHVL 
ERIDLKRDLH FQTATTIDTL DYSGSGLNSG SKVVFAAVGE KRRTLGVELP SSLSLADGFN 
DPCICLPGVI AVKGPACTVR KGEADPQMEA LCAALEGVEG LESFPLIVVC DDSRFAAKDL 
DNFLWVTFTR SDPAADIYGV GAGMVCKQWG CTGPLVIDAR VKPHHAPPLI EDPAVERKLD 
QLAAPGGPLH GLY