Gene Pars_2247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2247
Symbol
ID	5055067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	2014893
End bp	2015909
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	59%
IMG OID	640469800
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_001154445
Protein GI	145592443
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0921714
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.498116
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGTGC GGTTCCCCCA GCACAGGCCT AGGCGTCTCA GAGCCAGCAA GCTGATTAGA 
GACGCCGTGG CGGAGACGTC GTTAGATCCC AGCGACTTCA TATACCCCAT TTTTGTCAAG 
CCTTCCGGCG AGAAGGAGCA AATACCCTCC ATGCCCGGCC AGTACAGGTG GCCAGTGGGG 
GACGAATTGA CAAGGCACGT GGAGGAGGCC CTCGCCTTGG GCGTGAACAA GGTGATTCTC 
TTCGGGGTGG TGCCCGACGA GCTTAAAGAC TCGGCTGGGT CCCCTGGCTA CGACCCACAC 
GGCGTGGTGC CGAACGCCAT CCGGTTGCTA AAACAGACCT TCGGCGACAA GTTGCTTGTG 
TTCGCCGATG TCTGTCTCTG CGAGTACACA GACCACGGCC ACTGCGGCAT TGTAAGAGAG 
AGGCGGGGAA GGTGGTATGT GGACAACGAC GAGACTATAA AGCTGTACGC AAAAGAGGCA 
GTGACCTACG CCGACGCCGG TGCGGATTTT GTAGCGCCGA GCGGCATGAT GGACGGGCAA 
GTAGCCGAAA TAAGAAAAGC CCTAGACGCC CACGGCTTCC ACGACGTGGG GATAATGGCC 
TACAGCGCCA AGTACGCCTC TGCGTTCTAT GGCCCTTTCA GAGTGGCGGC GGCCTCTGCG 
CCTAAGTTCG GCGACAGGAG GACGTACCAG ATGGACCCCA GAAACGCCTA CGAGGCCGTC 
AAGGAGGTTA TGCTCGACTT AGAAGAAGGC GCAGATATCG TCATGGTCAA GCCGGCGCTG 
GCATACCTCG ACGTAATCCG CCTCGTGAAG ACGCACTACC CGTGGGCGCC CCTCGCCGCT 
TACAATGTGT CGGGGGAGTA CTCCATGGTC AAAGCCGCCG CCTCCCTCGG CTACGTAGAC 
GAACGCATCG TCACGTTGGA GATACTAACC GCCATAAAGA GGGCAGGAGC TCAGCTAATC 
CTCACCTACC ACGCCCTCGA AGCCGCCAGG TGGTTGAAGG AGGGCGTGCC GTTTTAG

Protein sequence

MHVRFPQHRP RRLRASKLIR DAVAETSLDP SDFIYPIFVK PSGEKEQIPS MPGQYRWPVG 
DELTRHVEEA LALGVNKVIL FGVVPDELKD SAGSPGYDPH GVVPNAIRLL KQTFGDKLLV 
FADVCLCEYT DHGHCGIVRE RRGRWYVDND ETIKLYAKEA VTYADAGADF VAPSGMMDGQ 
VAEIRKALDA HGFHDVGIMA YSAKYASAFY GPFRVAAASA PKFGDRRTYQ MDPRNAYEAV 
KEVMLDLEEG ADIVMVKPAL AYLDVIRLVK THYPWAPLAA YNVSGEYSMV KAAASLGYVD 
ERIVTLEILT AIKRAGAQLI LTYHALEAAR WLKEGVPF