Gene Pisl_0039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_0039
Symbol
ID	4618028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	+
Start bp	34968
End bp	35900
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	54%
IMG OID	639783120
Product	5-oxopent-3-ene-1,2,5-tricarboxylate decarboxylase
Protein accession	YP_929566
Protein GI	119871559
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.571239
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATATAA ACGACGGCCA ACGTCATGTT GTGAAACTAC TTACATTTAG AAGGGGGGAG 
GTTAGAAAAG TTGGGCTTTT TAAAAACGGC AGGATTTTAG ACTTGCCCGA GGCGTACAAA 
GCGGTGTTTA ACACAGAGGA GGCGCCAGAT TTTCTATACG ACATGAGACG CCTTATTGCA 
CTAGGCGAGC CTGCGCTTGA GATAGTTAAG AAGTTAGACG AGAGAGCCAG AGGGCCGTTT 
TACAAGCCAG AGGAGATAAA GTGGGAGCCG CCTGTGCCAA ACCCAGAGAA AATACTCTGC 
GTAGCCGTCA ACTACAGAGA ACACGGCGCC GAGACTGGGA TAGAGCCCCC CGACAAGCCC 
TACTTCTTCC CCAAGTTTCC AAATGCCCTA GTGGGCCACG AGGGCTATGT AGTGAAGCAC 
AGGGTGGTAC AGAAGCTAGA CTGGGAGGTA GAGCTCGTCG TCGTAATGGG GCGCCCCGGC 
AAATACATAG AGCCAGAGAG GGCGCTGGAC TACGTCTTCG GCTACACCGT CGGGCTAGAC 
ATGTCTATGC GCGACTGGCA GAACCCAGAC GAGAAGACCG CCAGACAGTA CGGAAAGAAC 
TGGATATGGG GCAAGACTAT GGACACCGCC GCGCCTGTGG GCCCGTACAT TGCGACAAGA 
GACGAGGTGC CAGACCCCAA CAGACTGGGG CTGAGGCTTT GGGTAAACGG CCAGCTAGAA 
CAGGAGGGAA ACACCTCCCA GCTCATCTTC AATATCCAAC AGTTGATATA CTGGGCATCC 
CAAGGCATAA CCCTCCGCCC CGGCGACCTC ATTTTCACAG GGACGCCGCC CGGGGTGGGC 
TGGGCCAAGG GGAAGTTCTT AAAGGGGGGA GACATCGTAG AGGCCGAGGT GGAGTCTATA 
GGCCGTCTCA GAGCGTATAT AATTGAGGAG TAG

Protein sequence

MYINDGQRHV VKLLTFRRGE VRKVGLFKNG RILDLPEAYK AVFNTEEAPD FLYDMRRLIA 
LGEPALEIVK KLDERARGPF YKPEEIKWEP PVPNPEKILC VAVNYREHGA ETGIEPPDKP 
YFFPKFPNAL VGHEGYVVKH RVVQKLDWEV ELVVVMGRPG KYIEPERALD YVFGYTVGLD 
MSMRDWQNPD EKTARQYGKN WIWGKTMDTA APVGPYIATR DEVPDPNRLG LRLWVNGQLE 
QEGNTSQLIF NIQQLIYWAS QGITLRPGDL IFTGTPPGVG WAKGKFLKGG DIVEAEVESI 
GRLRAYIIEE