Gene Athe_1507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1507
Symbol
ID	7408166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1591790
End bp	1593091
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	37%
IMG OID	643715870
Product	Phenylacetate--CoA ligase
Protein accession	YP_002573378
Protein GI	222529496
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1541] Coenzyme F390 synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATGGT CTGAATATGA AAAACTCAAT AGAAAACAGT ATGAAGAACT GCAGCTTGAA 
AGACTTAAAA GAACGGTAGA AAGGGTTTAT GAAAATGTTC CTTTTTACCG TAAAAAATTT 
GATGAAATAG GAGTAAAGCC ACATCATATT AAGAATTTAA AAGATATTCG GCTTCTTCCC 
TTCACAACTA AGGATGACCT GAGAGAAAAC TATCCGTATG GTCTTTTTAC TGTCCCTCTT 
TCAAAAATTG TTAGAATTCA TGCCTCCTCA GGCACAACAG GTAAGCCAAC CGTTGTAGGA 
TATACAAAAC ATGACATGGA AGTGTGGACA GAGGTTGTTG CAAGAATAGT CACAGCAGCA 
GGTGTCAGAG AACATGATAT TGCTCAGATT GCTTTTGGTT ACGGACTCTT TACTGGTGCT 
TTTGGACTTC ACCAGGGTTT AGAGAGAGTT GGTGCAACAG TAATTCCAAT TTCAAGTGGT 
AATACTGAAA AGCAGCTTAT GGTTATGCAG GATTTTGGTG CTACAGTTTT GGTATGTACA 
CCGTCTTATG CACTTTACAT AGACGAGGTT GCAAATGAAC TTGGCATTGA TAAGTCAAGG 
ATAAAACTAA GACTGGGCCT TTTTGGTGCA GAAGCTTCAA CAGTTGAGAT GAGAAGAGAG 
ATTGAAAAGA AGTGGGGACT TTTTGCAACA GAAAATTATG GACTTTCTGA AATAATTGGT 
CCAGGGGTTT CTGGAGAGTG TGAATATAGA GAAGGGTTAC ATATAAATGA AGACCATTTC 
TATCCTGAGA TAATAAATCC CGACACAGGA GAGGTTCTTG AAGAAGGAGA AACAGGAGAG 
CTTGTATTAA CAACCATTAC AAAAGAAGGT ATGCCTCTTA TAAGATATAG AACAAGGGAT 
ATCACCTCAC TTATATATGA GCCATGCAAG TGCGGAAGGA CAAATGTGAG AATGACATCT 
GTTAAAGGAA GAACAGATGA TATGCTAATA ATCCGAGGTG TCAATGTATT TCCCTCTCAG 
ATAGAAAGTG TTCTAATGGG AATTGAAGGT ATAGGTCCTC ACTATCAACT TGTTGTCACA 
AAGAAAGGAT ATTTGGATGA TTTGGAAGTT CATGTAGAGC TTGTTGATGG AAAACTTTTG 
GAAAGATATG CTGAACTCGA GAAATTAGAA AATAAGATAA AGCACAGGAT ATTTACTGTA 
TTGGGATTAA ATGTTAAGGT AAAACTTGTT GAACCGAAAA CTTTAGAAAG AACTACTGGA 
AAGGCAAAAA GAGTAATTGA TTTGAGAAAT AAAACCAATT AA

Protein sequence

MIWSEYEKLN RKQYEELQLE RLKRTVERVY ENVPFYRKKF DEIGVKPHHI KNLKDIRLLP 
FTTKDDLREN YPYGLFTVPL SKIVRIHASS GTTGKPTVVG YTKHDMEVWT EVVARIVTAA 
GVREHDIAQI AFGYGLFTGA FGLHQGLERV GATVIPISSG NTEKQLMVMQ DFGATVLVCT 
PSYALYIDEV ANELGIDKSR IKLRLGLFGA EASTVEMRRE IEKKWGLFAT ENYGLSEIIG 
PGVSGECEYR EGLHINEDHF YPEIINPDTG EVLEEGETGE LVLTTITKEG MPLIRYRTRD 
ITSLIYEPCK CGRTNVRMTS VKGRTDDMLI IRGVNVFPSQ IESVLMGIEG IGPHYQLVVT 
KKGYLDDLEV HVELVDGKLL ERYAELEKLE NKIKHRIFTV LGLNVKVKLV EPKTLERTTG 
KAKRVIDLRN KTN