Gene GM21_2035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2035
Symbol
ID	8137371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2359123
End bp	2360427
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	62%
IMG OID	644869650
Product	Phenylacetate--CoA ligase
Protein accession	YP_003021845
Protein GI	253700656
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1541] Coenzyme F390 synthetase
TIGRFAM ID	[TIGR02155] phenylacetate-CoA ligase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.00000000000365841
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTCTTCA ACGAGGAGTT CGAGACGCTT CCCAGGGAGG CTATCGAGGC ACTGCAGCTT 
AAAAGGCTCA AGGCGATGGT GGCGCGCGTT CAACAAAACG TCCCCTTCTA CAAGGAGTCG 
CTGGCCAAGG CGGGAGTCGG CGCCGATTCC ATCAAGTCGC TTTCGGACCT GGCCCGGCTC 
CCCTTCACCT ACAAGCAGGA CATGCGCGAC TCCTACCCGT ACCGCCTCTT CGCAGTGCCG 
ATGGAGGACA TCGTCCGCAT CCACGCCTCT TCCGGCACCA CCGGCAAACC CACGGTGGTC 
GGCTACACCC AGAAGGACAT CGACACCTGG AGCGAGCTGA TGGCGCGCTC GTTCGTCGCA 
GCCGGGGTGC ACAAGGGCGA CATCATCCAC AACTCCTACG GCTACGGCCT CTTCACCGGC 
GGCCTGGGCG CGCACTACGG CGCTGAGCGG CTGGGGGCGT CCGTCATTCC GATGTCAGGG 
GGTAACACCA AGAAACAGAT CATGATCATG CAGGACTTCG GTTCCACCGT CCTCACCTGC 
ACCCCTTCCT ATTCGCTCTA CATGGCGGAG GCCGCCAAGG AGGAGGGGGT CGACTTCCGC 
GATCTGAAGC TCAAAGTCGG CATCTTCGGC GCCGAGCCCT GGTCCGAGGC GATGCGCCTC 
GACATCGAGG AGAAGCTGAA TCTCTCCGCC GTCGACATCT ACGGGCTCTC GGAAATCATG 
GGACCCGGCG TCGCCATCGA GTGCTGCGAG GCGAAACAGG GGCTCCACGT CTGGGAGGAT 
CACTTCATCC CCGAGATCAT CAACCCCGAG ACCGGCGAAG TGCTTCCCGA AGGCGCTAAG 
GGGGAGCTGG TCATCACCAC CATCACCAAG GAAGGGATCC CGCTGATCCG CTACCGGACC 
CGCGACATCA CCTCCATCAC CTACGAGCCC TGCATCTGCG GCAGGACCCA TGCCCGCATC 
GCCCGCATGA GCGGCAGAAG CGACGACATG CTGATCATCC GCGGAGTCAA CGTCTTCCCG 
TCGCAGATCG AGGCGATCCT CATGGGGGTC GAAGGGGTCG AGCCGCACTA CGTCCTCATC 
GTGGATAGAA AGGACAACCT GGACACCCTC GAGGTGCAGG TCGAGGTGGG CGAGGACATC 
TTCTCCGACG AGATCAAGCA CCTCCAGGCG CTCTCGACCA AGATCGAGAA GCAGATCAAG 
GAGATGCTGG GGGTCACCTG CCGCGTCAGG CTCGTGGAAC CCAAGAGCAT CACCCGCAGC 
GAAGGCAAAG CCAAGAGGGT CATCGACAAC AGGAACAAAG CCTAA

Protein sequence

MFFNEEFETL PREAIEALQL KRLKAMVARV QQNVPFYKES LAKAGVGADS IKSLSDLARL 
PFTYKQDMRD SYPYRLFAVP MEDIVRIHAS SGTTGKPTVV GYTQKDIDTW SELMARSFVA 
AGVHKGDIIH NSYGYGLFTG GLGAHYGAER LGASVIPMSG GNTKKQIMIM QDFGSTVLTC 
TPSYSLYMAE AAKEEGVDFR DLKLKVGIFG AEPWSEAMRL DIEEKLNLSA VDIYGLSEIM 
GPGVAIECCE AKQGLHVWED HFIPEIINPE TGEVLPEGAK GELVITTITK EGIPLIRYRT 
RDITSITYEP CICGRTHARI ARMSGRSDDM LIIRGVNVFP SQIEAILMGV EGVEPHYVLI 
VDRKDNLDTL EVQVEVGEDI FSDEIKHLQA LSTKIEKQIK EMLGVTCRVR LVEPKSITRS 
EGKAKRVIDN RNKA