Gene Pars_2103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2103
Symbol
ID	5054632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1879189
End bp	1880406
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	58%
IMG OID	640469655
Product	acyl-CoA dehydrogenase domain-containing protein
Protein accession	YP_001154301
Protein GI	145592299
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.136708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTCG GGCTTTCTAG AGAGGACAAA CTTTTCCTAG ACTCTGTAAG GTCTTTTGCC 
GAGAGGGTTA TCGCCCCTCG TTGGGTTGAA ATTGACGAGA GGAAGTGGCC TATTGAGGAG 
GTCGCCGCCA GGCTCGGGGA GGCTGGCCTC TTGGGGATTC CGCTGAGTTC TAAGTACGGG 
GGGCAAGACG GGACGTTTCT GCAAGCGGCT CTGGCGGCGG AGGAGCTTGC CTACGCCGAC 
CCGTCTCTCG CGACGCCGGT CTACATGTTA TTGGAGACGG CGTGGCCCTA CGTGGTTCAG 
CTCTACGGCC GGGAGGAGGC CAAGAGCGAG GTTCTTCCCG AAATGACGAA GGGTAGGGCG 
TTTATTGGGA TAGCCTCTAC CGAGCCCCAG GGCGGAAGCG ACGTGGCGTC TTTCCAGACT 
AAGGCGGTGA AGGAGGGCGA CGTGTGGAGG CTCTACGGCG AGAAGAACAT GGTGACTGGC 
GTTACTACAA TACTCAATCT GCCTTACGGA GGCGGCGTCG TGGCGATTAC GAGAACTGGG 
AGGCTGGAGG ACAAGCACAG GGGGATAACA GTCTTCCTCG CCCTGCTGAA GAGGAGGGGG 
AGGGTGACGC CTGGGTTTTC CCACAGGGAT TGGGACGAAA TTGGCCGCCA CGGCCTGCCC 
ACGGGTTATT TAATGCTGGA GGGGCTCCCG GTGGAGGACG CCTTTATGCT TGGGGAGGTC 
AACGGCGGTT TCAAGATCGC GATGGAGGGC TTCAACCTTG CCAGGACTAT AATAGGCGCG 
GCATCAATCG GCGCGGCGCG TTGGCTTCTC GACAAGGCAC TTGAGTGGAT AAGGCAGAGG 
GTGGTTTTCG GGAGGCCTAT TGCGTCTTAC CAGGGTGTGT CGTTTAAATT CGCCGAGCTT 
TACGCCAGGC TCGAGTCTGC GAGGCTAGCC GTGTACAAGG CTGCGTGGGT CGCCGATAGG 
CACTATGGCG GCGACGCGGC GTTTACTCTT CAAGACGTGG CGACGGCTGG CGCAGTCGCT 
AAATACCTCG CCGTTAGCCT TGCGGTGGAG ACGGCGCTTG AGGTTATGAA GTGGTTCGGC 
GGCGCGTCGT ACTACAAGGA GACAAATGTC GCCAGATCGC TGTTGGGGAT TTTATCGTAC 
TACGTGGGCG CCGAGGGTGC TGAGAACATA TTGAAGCTGA TAATAGCTAG GAACATAATT 
GGGAGGGAGT TTATTTAA

Protein sequence

MDFGLSREDK LFLDSVRSFA ERVIAPRWVE IDERKWPIEE VAARLGEAGL LGIPLSSKYG 
GQDGTFLQAA LAAEELAYAD PSLATPVYML LETAWPYVVQ LYGREEAKSE VLPEMTKGRA 
FIGIASTEPQ GGSDVASFQT KAVKEGDVWR LYGEKNMVTG VTTILNLPYG GGVVAITRTG 
RLEDKHRGIT VFLALLKRRG RVTPGFSHRD WDEIGRHGLP TGYLMLEGLP VEDAFMLGEV 
NGGFKIAMEG FNLARTIIGA ASIGAARWLL DKALEWIRQR VVFGRPIASY QGVSFKFAEL 
YARLESARLA VYKAAWVADR HYGGDAAFTL QDVATAGAVA KYLAVSLAVE TALEVMKWFG 
GASYYKETNV ARSLLGILSY YVGAEGAENI LKLIIARNII GREFI