Gene Pisl_2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_2001
Symbol
ID	4618311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	+
Start bp	1816929
End bp	1818092
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	56%
IMG OID	639785092
Product	ArsR family transcriptional regulator
Protein accession	YP_931491
Protein GI	119873484
COG category	[K] Transcription
COG ID	[COG4742] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCGCG TTTTCGAAGC CCTCGCCCAC CCCATTAGGA GGAAGATACT AAAGCTTCTT 
GAGGAGAGGC CGAGGAGCTA CAGCGAGTTG ATGGAAGAGC TGGGCGTAGA CAGCCCCACC 
CTCGCCTTCC ACATCAAAAA ACTTGGGGGT CTCGTAGAGA AAAACGAGAG GGGGTTCTAC 
ATTCTGACAG AGGCCGGGCG GAGGGCTCTC TCTGTGGTAA AACAGCTCGA GACAGAAGCC 
GCTCAGTCTC TGGATATAAA AGAGCTTGAG CTCAGCGACA GAGTCTTTCT AAAGGTGGGG 
AGAGACCTCC TGGAGCTAGC CAAGCGAGAG GGGAAAAAGG TGCGGATTTT CGACACGGCA 
GTGGTGGAGT TTGAAAAAGA CATACCGCCG GAGCTCTTCT ACGAAGTAGT CGAAGAGATT 
AGAGACGTGG GGGTTGTAAA AACGCCGAAA CACCTCCGCC CATACGTAGA GACTAGGGTA 
AGAGACGTGG GGATTGTCAC TGAGAGAAGC CTCTTGTCCA CTCTCCTAAA GCTTGTTGTA 
GAAGTCCTTG CGCTAGGCGG CGTGAAGTCT GGAGTTAGGC GGAGGAGAGA GCTTGTGGAA 
GTGTACCGCG GCCCCCTCAG CCACGGGGGG AGGGTGGAGG TGGAGGTGGC GGGGGGCAGA 
GTGAAAATCT TCGGGGGGCC TAACCAAGTG GTGGCGAGGT GTGAAGACGC CAGAGATTTC 
GAAGTGGGAG ACGGCCGCAT CTCTGCCGAG GGGTGTGAAG TTGAGATGGC GCTTTTAGAG 
GTCAAGTCTC TATCTCTCGA CGTCGCAGGC GGCGATGTAG AGATCTCCCT CAGTCTCTCA 
AACTTAAAGG CCGACGTCTC TGGCGGCGTT GTTAAAGCCG ACCTAGCCCT GGCCGGGGGA 
GATGTAGAAA TTGACCTCAG CGGCGGAGTT TTTACAGGGA GGCTGAAGTA CAGCGTGTTT 
GAAGGCGCCG CCAGCCTAAA GCTAGATCTA GCCGGAGGTG CTGCTAGGCT AAAGCTAGAC 
CTCCCGCCGG AGGTAGGTCT CTTTGTCGCG ACAGAGTCTG AAGGAGGCGT TGTGAGAACT 
CCCAAGCCGA GGCCCGGCGG CCGGGGCGTT TTACAAACGT ATATAAAGGC GGCGGGAGGA 
ATCGTGGATA TCGCGCTGGA CTAG

Protein sequence

MDRVFEALAH PIRRKILKLL EERPRSYSEL MEELGVDSPT LAFHIKKLGG LVEKNERGFY 
ILTEAGRRAL SVVKQLETEA AQSLDIKELE LSDRVFLKVG RDLLELAKRE GKKVRIFDTA 
VVEFEKDIPP ELFYEVVEEI RDVGVVKTPK HLRPYVETRV RDVGIVTERS LLSTLLKLVV 
EVLALGGVKS GVRRRRELVE VYRGPLSHGG RVEVEVAGGR VKIFGGPNQV VARCEDARDF 
EVGDGRISAE GCEVEMALLE VKSLSLDVAG GDVEISLSLS NLKADVSGGV VKADLALAGG 
DVEIDLSGGV FTGRLKYSVF EGAASLKLDL AGGAARLKLD LPPEVGLFVA TESEGGVVRT 
PKPRPGGRGV LQTYIKAAGG IVDIALD