Gene Pisl_1965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_1965
Symbol
ID	4617743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	-
Start bp	1781636
End bp	1782772
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	53%
IMG OID	639785056
Product	amidohydrolase
Protein accession	YP_931455
Protein GI	119873448
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0906256
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.000000000345538
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGTGTATAA GAGTCGAAGG CAGAGCGTAT ATAGGTGGAC ATTTCGTCCG GATAAGACTG 
GGGAGGGAGG GGTGTAAGAC TGTACAGTTT TCAAACGACT ACATAATACT GCCCGGGATG 
GTCGATATAC ACGTCCACTT CCGCGACTGG GAGTTGGCAC ATAAGGAGAC TTTAGAAGGC 
GGAGCCGCGG CGGCGTTGGC AGGAGGCGTA GTCGCCGTGG GCGATATGCC AAATACAAAA 
CCCCATATTA GAACTGCAGA GCTCTACAAG AAGAGGCTAG GGGAGGGGGC GCGGTTGCCC 
ATAGTATACA GAGTGCATAT GGGAGTGCCT GTGGACCTTA GAGAGTTAGA TATAGCAAGG 
CCTCCTACTG TGAAGGTTTA CCCAGAGGAT GTAGCAGAGT TCGGCTGGGG GCATATAGAG 
GCGCTCGCGA GGAGATGTGC CGGCCTTGGA TGTACATTAA TCTTCCACTG TGAGGACCCG 
GCTTATTTTA AAGACGGCGA GAGGCCGCCG GAGGCTGAGA TGGCGTGTGT TGAAAAGGCG 
AGACGTCTCG CCTGGGATAC AGAGGCCAGA GTCCATCTGA CGCATGTCTC TCTACCTCAG 
ACTGTCGATA TAGCCAGGGG CTGGGCCACG GTAGACGTAA CTCCACACCA TCTATTTCTA 
GACAGAGAGA ACTGTAAGCT AGGCGGTTTA TGTCTAGTCA ACCCGAGGCT TAGGGAGCCG 
GGACTTAGAA AACTACTCCT CGCCCGTCTC GCCGCCGGGC TTGTGGATAT ATACGCCACA 
GACCACGCCC CGCATACGCC GGAGGAGAAA AAGTCAGACA GCCCGCCGCC GGGCATATGT 
AGCTTAGACA TAGCGCTCAG CTTGTTGCTT TCTCTCTGGA AGAGGGGGGT GTTAACACTA 
GACGACGTCG TACGGCTATA TTCCCACAGA CCCGCGCGTT TCCTCAATGT AAACAACGAT 
ATTATAGGCG GCGTATTTAC AATTATCAAG CTCGAGGAGT TTACAGTAAG GGGGGAGGAA 
TTTGCCGGCA GGTGTAAATA TACGCCGTTT GAGGGGTTTA GAGCATTTGG CGTAGTCGTC 
GCCACTGCAG TTGGCGGAAA AATCTTCTTT AGAAATGGCG AAGTGTACGA CGTTTAG

Protein sequence

MCIRVEGRAY IGGHFVRIRL GREGCKTVQF SNDYIILPGM VDIHVHFRDW ELAHKETLEG 
GAAAALAGGV VAVGDMPNTK PHIRTAELYK KRLGEGARLP IVYRVHMGVP VDLRELDIAR 
PPTVKVYPED VAEFGWGHIE ALARRCAGLG CTLIFHCEDP AYFKDGERPP EAEMACVEKA 
RRLAWDTEAR VHLTHVSLPQ TVDIARGWAT VDVTPHHLFL DRENCKLGGL CLVNPRLREP 
GLRKLLLARL AAGLVDIYAT DHAPHTPEEK KSDSPPPGIC SLDIALSLLL SLWKRGVLTL 
DDVVRLYSHR PARFLNVNND IIGGVFTIIK LEEFTVRGEE FAGRCKYTPF EGFRAFGVVV 
ATAVGGKIFF RNGEVYDV