Gene Athe_1010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1010
Symbol
ID	7407912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1107481
End bp	1108728
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	37%
IMG OID	643715375
Product	Phenylacetate--CoA ligase
Protein accession	YP_002572884
Protein GI	222529002
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1541] Coenzyme F390 synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.45626
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAGTG TTGAGATGAG AGAAAATGTA AGTGAACTTT TTTTGAGCCA GCTCGAAAAT 
GTCTTTAAAA ACAGTCCTTT TTATCAAAAA AAATTCAAAG AAACAGGGGT AAAACTTAGT 
AAGATACAGG ACTTAGATGA TATCAAAAAA CTTCCATTTA CAACAAAAGA AGAGTTAAGA 
GATGCTTATC CCTTAGGGCT TATGGCTGTT GATGAGAAAA AGGTTGTAAG AATTCACTCT 
TCGTCAGGTA CAACTGGAAT GCCAGTGATT ATTCCTTACA CTCAAAAAGA TGTTGATGAC 
TGGAAAGAAA TGATGAAAAG GTGTTATCAG TTAGCAGGTG TAACAGAGCT GGACAGAGTC 
CAGATAACTC CTGGATATGG CCTTTGGACA GCAGGTATTG GATTTCAGCT TGGTGCTGAG 
TTTTTGGGTG CGATGACAAT TCCTATGGGG CCCGGAAATA CAGAAAAACA GCTTCAGATG 
ATGGTGGATT TAAAGTCAAC AGTCATTATT GCGACTTCAT CTTACGGGCT TTTGCTTGCT 
GAAGAGGTAG TTAAAAGAGG TTTAAAAGAC AAGATACATT TAAGAATTGG GATATTTGGT 
TCTGAAAGAT GGGGAGAAAA ACAGCGAAAA ACTATTGAGG CGTATCTGGG CATAGAAAGT 
TTTGATATTT ATGGGTTAAC AGAGATTTAT GGACCGGGAA TTGCAATAGA TTGCAAAAAA 
CATACAGGCC TTCATTATTT TGATGATTTT CTGTATTTTG AAATAATTGA CCCTCAAACA 
GGAGAGAATG TGCCTGATGG AGAGTTTGGT GAACTTGTTA TTACCACTTT GAGAAAAGAA 
GGTGCTCCTC TTATAAGATA CAGAACAAGA GACATCACAC GAAAAATTCC AGGTGAGTGC 
AGTTGTGGTT CTAAGTATCC ACGTATTGAC AGGATTGTTG GTAGAACTGA CGACATGATA 
AAGGTCAAAG GTGTTAATAT CTTTCCTGCT CAGATAGACA CATTTTTGAA TGATGTAGAT 
GGTGTTGGAA GTGAATATCA AGTGATTATA GAGAGGATTG ATTACAGGGA TAAACTTACA 
TTAAAGGTTG AGGTTAAAGA TGAATATTTT ACTTCTGAGA TGAAAGAGTT AATCTCTCAT 
GAATTTAAAA ATAAGATAGG AGTATCGCCT GAGGTCATTT TGTGCAGGGT AGGTGAACTT 
CCTCGAAGCG AAAAGAAGAC AAAACGCATA TTTGATTTGA GAGGCTGA

Protein sequence

MESVEMRENV SELFLSQLEN VFKNSPFYQK KFKETGVKLS KIQDLDDIKK LPFTTKEELR 
DAYPLGLMAV DEKKVVRIHS SSGTTGMPVI IPYTQKDVDD WKEMMKRCYQ LAGVTELDRV 
QITPGYGLWT AGIGFQLGAE FLGAMTIPMG PGNTEKQLQM MVDLKSTVII ATSSYGLLLA 
EEVVKRGLKD KIHLRIGIFG SERWGEKQRK TIEAYLGIES FDIYGLTEIY GPGIAIDCKK 
HTGLHYFDDF LYFEIIDPQT GENVPDGEFG ELVITTLRKE GAPLIRYRTR DITRKIPGEC 
SCGSKYPRID RIVGRTDDMI KVKGVNIFPA QIDTFLNDVD GVGSEYQVII ERIDYRDKLT 
LKVEVKDEYF TSEMKELISH EFKNKIGVSP EVILCRVGEL PRSEKKTKRI FDLRG