Gene Pisl_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_2000
Symbol
ID	4616382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	-
Start bp	1815767
End bp	1816822
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	57%
IMG OID	639785091
Product	amidohydrolase
Protein accession	YP_931490
Protein GI	119873483
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTCTCC GCGCGCGCTA CATCCTCACG GGAGAGCTTG AAGTTGTGGA AAACGGCGTC 
GTAGAGGTAA ACGACGAGGG CGTGGTGGCG GGGGTGGGTA AATACACTGG GGGTGTCGCC 
GCCGATCTTG GCAACGTAGT GCTTATGCCT CAGCTCGTCA ACGGCCATGT ACATGTTTTA 
GACGTCGCCA TGTTAGACAG AGACGATATG TATATCGACG ACTTAGTGGG GTGGCCCCAC 
GGCGTGAAAT ACCACGTCGT TAAAAAACTT GTGAAGAAGG GTAAACACAT CCCACTTCTA 
GAGAAGGTGG CGAAGAGAAT GAGGAGATAT GGCGTGGGGT GCGCCCTGGT ATACGCAGAA 
TATGCGGCGA GAGATGTAGA AGAGGTGTTC CGGCGGTGGG GGGTAGAGAC TGTAGTCTTC 
CAAGAGGCCC ATGGCGGCTT TCCAAACTAT CCCAATGTCC AAGTGGCCAC TCCCGTCGAC 
CACCCCCCAG AGTACCTCCG GCAACTCAGA GCCAGGTATA AGCTAGTCTC TACCCACGTC 
TCTGAGACAA AAGACTGCCA CGAAGCCGGC GATCTAGAGC TCGCGCTAAA GGTGTTAGAT 
GCGGACGTTT TAATACACCT TGTATATATC ACGCCCGAGG AGGTCGCGGA GATCCCGCCG 
TCAAAGACTG TCGTGGTGAA TCCCAGGGCC AACGCCTATT TCGTTGGGCG GGTGGCGCCG 
GTGCCCCAGC TACTACACCT AAAGCCCCTA CTCGGCACAG ACAATGTCTT TATGAACGAA 
CCAGACCCCT GGGCCGAGAT GAAGTTTCTC CACGCCTACG CCGCCGCCTC TGGCTGGAGA 
CTGGGCGAGA AAGAGATACT CGCAATGGCC ACGGTCTGGG GCTGGGAAAA AATGAGGTGC 
ATCCCGCCGA TTGAGCCCGG CCACAGGCTC AGGGCACTCG CCGTGGCGGC GCCATACGCA 
GGAGAAAAGG TGTTGAAGTT CTTGGTGAAG AGGGCCGCCC ACACAGACCT AGTGGCATTG 
GTGGAGGGCG CCTCTATAGA GCCGCCCCCC TCCTGA

Protein sequence

MRLRARYILT GELEVVENGV VEVNDEGVVA GVGKYTGGVA ADLGNVVLMP QLVNGHVHVL 
DVAMLDRDDM YIDDLVGWPH GVKYHVVKKL VKKGKHIPLL EKVAKRMRRY GVGCALVYAE 
YAARDVEEVF RRWGVETVVF QEAHGGFPNY PNVQVATPVD HPPEYLRQLR ARYKLVSTHV 
SETKDCHEAG DLELALKVLD ADVLIHLVYI TPEEVAEIPP SKTVVVNPRA NAYFVGRVAP 
VPQLLHLKPL LGTDNVFMNE PDPWAEMKFL HAYAAASGWR LGEKEILAMA TVWGWEKMRC 
IPPIEPGHRL RALAVAAPYA GEKVLKFLVK RAAHTDLVAL VEGASIEPPP S