Gene Pisl_0042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_0042
Symbol
ID	4617705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	+
Start bp	37219
End bp	38229
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	59%
IMG OID	639783123
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_929569
Protein GI	119871562
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0725426
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTCC CAACTGTCAG ACCCCGCCGC CTCAGGACAA ACAAAATCAT TAGAGACGCC 
GTTGCCGAAA CTGCCCTCGA CCCCAGCGAC TTCATCTACC CCATCTTCGT CAAGGAGGGC 
CCCGGCCGAG AGGCCATACC CACCATGCCC GGCCAACACC GGTGGCCCGT CGGCGAGGAG 
CTAATTAAAC ACGTAGAGGA GGCCCTCGCC CTAGGAGTCA ACAAGTTCAT CCTATTCGGC 
GTGGTGCCAG AGGAGCAGAA AGACCCCCAC GGCTCCAGGG GCTACGACCC AGAGGGCCCC 
GTCCCCAAGG CCCTCCGCCT CCTAAAAGAG ACCTTCGGCG ACAAGATACT CCTCTTCGCA 
GACGTCTGCC TCTGCGAATA CACAGACCAC GGACACTGCG GCGTGGTAAA GACCACCGGC 
GGCAGGTGGC ACATTGACAA CGACGAAACT ATAAAGCTAT ACGCCAAGGA GGCCCTCGTG 
TACGCAGACG CCGGCGCTGA CTTCGTCGCC CCAAGCGGCA TGATGGACGG CCAAGTGGCC 
GAGATCAGAA AAGCCCTAGA CGCCCACGGC TTCCACCACG TGGGCATCAT GGCATACAGC 
GCCAAATACG CCTCAGCCTT CTACGGCCCC TTCCGCACAG CCGCCGCCTC AGCCCCCAAA 
TTCGGCGACA GGAGGACATA CCAGATGGAC CCCAGAAACG CCCACGAAGC CCTCAAAGAA 
GTCGCCATGG ATCTGGAGGA GGGCGCAGAC ATAGTCATGG TAAAGCCAGC CCTCGCATAC 
CTAGACGTAA TCCGCCTAGT AAAACAGCAC TACCCCTGGG CCCCCCTAGC CGCCTACAAC 
GTCTCCGGAG AATACGCCAT GGTAAAAGCC GCCGCAGCCG CCGGATATAT AGACGAGAGG 
GTCGTCACAC TAGAAATCCT AACCGCAATA AAAAGAGCAG GCGCAGACCT AATCCTCACC 
TACCACGCCC CAGAAGCCGC AAAATGGCTA AAAGACGGCA CCCCATTCTA G

Protein sequence

MKFPTVRPRR LRTNKIIRDA VAETALDPSD FIYPIFVKEG PGREAIPTMP GQHRWPVGEE 
LIKHVEEALA LGVNKFILFG VVPEEQKDPH GSRGYDPEGP VPKALRLLKE TFGDKILLFA 
DVCLCEYTDH GHCGVVKTTG GRWHIDNDET IKLYAKEALV YADAGADFVA PSGMMDGQVA 
EIRKALDAHG FHHVGIMAYS AKYASAFYGP FRTAAASAPK FGDRRTYQMD PRNAHEALKE 
VAMDLEEGAD IVMVKPALAY LDVIRLVKQH YPWAPLAAYN VSGEYAMVKA AAAAGYIDER 
VVTLEILTAI KRAGADLILT YHAPEAAKWL KDGTPF