Gene Pars_0795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0795
Symbol
ID	5054710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	707997
End bp	709106
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	58%
IMG OID	640468356
Product	acetyl-CoA C-acyltransferase
Protein accession	YP_001153033
Protein GI	145591031
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGACG TATACGTAGT AGGCGGGGCC CTCCACCCCG CTGGGCGTCA TTACGACAAG 
AATATCGACG ATCTCGCTGC CGCCGTGTTA GACAAGGCGA TCGCAGACGC CCAGGCGGAT 
ATAGAGGCCC TCTTTTTGGC CTCCTCCACC GCCGAACTCG GCAACAAGCA ACAACTACTC 
GGCGTTTACG TGTTGGAGTC GCTTGGCTTG GATAAGATAC CGGTTTTTAG GATTGAAAAC 
GGCGATGGAT CCGGCGGCGC CGCAGTGGTA GCGGCGTACC ACGCGTTAAG GGCCGGGGAG 
TACAACTGCG TTGCCGTCGT GGGCGTGGAT AAGCCAAACG ACGTCTTGAG CAACCAGCAA 
CAGGACATAT ACGCCACCAC GCTCGACACT CACTTCGAGC GGTACTTCGG CTTCACCCCA 
CTCTCCTACG CTGCGCTTAT GGCGAAGATG TACTTAAAGA AGTACGAGTA CAAGTACGAG 
GACTTGGCCA GGTGGGCTGT CCTAATGCAC GCTCACGGAG CTGGGAATCC CTACGCCTAT 
TTCAGACGCC CCGTCAAGCT GGAAGACGCC GTGAACAGCG AAGTTGTCAG CGAGCCTCTC 
CGCCTATACG ACGTAGGCCC CTTGGCCGAC GGGGCGGCGG CCGCCGTGTT GTGCAACAAC 
AAAAAGAAAG ATGGGCCACG GATACTTTCA GTGACGACCT CGACAAATGC TGTGGGCTTC 
AACGCGAGGA ACGAATACGA CGTCCTCTAC AGCCTCGAAG AAGCGGCGAG AAGCGCGCTG 
AAAAAAGCCG GCGTTACGCC TAGGGACATC GCCGCGGCGG AGGTCCACGA CTCCTTCTCC 
ATATTCGGCG CATTGGCGTT AGAGGGGCTT GGCATTGTGA AGAGGGGAGG CGCTCTGGCC 
GCGTTGAGGG AAGGGGACTT GCCGGTGAAT CTCAGCGGCG GTTTTAAGGC CCGGGGGAAT 
ATTCTAGGCG CCACCGGCGT GTACCAAGTG GTGGAGTTGG CGTGGCAACT CATGGGCCGG 
GAGTTTAAAC GGGTTGAGGG CAACTACGGA GTTGTCCACA GCATGGGCGG CGTAGATAGG 
GTTTCGACAG TTATTGTAGT AGGATTATGA

Protein sequence

MKDVYVVGGA LHPAGRHYDK NIDDLAAAVL DKAIADAQAD IEALFLASST AELGNKQQLL 
GVYVLESLGL DKIPVFRIEN GDGSGGAAVV AAYHALRAGE YNCVAVVGVD KPNDVLSNQQ 
QDIYATTLDT HFERYFGFTP LSYAALMAKM YLKKYEYKYE DLARWAVLMH AHGAGNPYAY 
FRRPVKLEDA VNSEVVSEPL RLYDVGPLAD GAAAAVLCNN KKKDGPRILS VTTSTNAVGF 
NARNEYDVLY SLEEAARSAL KKAGVTPRDI AAAEVHDSFS IFGALALEGL GIVKRGGALA 
ALREGDLPVN LSGGFKARGN ILGATGVYQV VELAWQLMGR EFKRVEGNYG VVHSMGGVDR 
VSTVIVVGL