Gene Pisl_1021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_1021
Symbol
ID	4617320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	-
Start bp	921661
End bp	922743
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	43%
IMG OID	639784118
Product	major facilitator transporter
Protein accession	YP_930538
Protein GI	119872531
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.394996
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	1.70461e-18
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGAGAATAA ACTTCGCAAC TCTCCTTTTT TTCATAGCTA ACGGTATAGT TGTAGTTGCT 
ATTCCACCCT ATTTACGCGA CTTAGGAGTG ATCAGCGAAT CTACGATAGG CACAATAATA 
TCTACGGCGT TTTTCGTCTC CGTTATAGTA AGGCCGTTAA GCGGCTTTAT AGGAGATAAA 
GTGGGTTATG TAAAAGTGAT GAGGATAGGC GTTGTCTTTG CTGTTATGTC GCAAATTATG 
TATCTACTTA GCAACCCGCT ATGGGTTCAA ATTGGCAGAG TTTTTCATGG TTTTGCAATA 
GGAACTTTTC TTCCGATGTC TATAGCTATT TCAGTCACAG AGGGAGCCAA AGCCATGGCA 
ACACGCTCTT TAGCTGTTGG TATCGGAAAC GTAGTAGGCC CCCTTATAGG TTCCATATTA 
TACGACCTTG GCGGGGGCCG TCTATCCATC ACGGTGGCAT TACTCTTACA TACAATCAAT 
TGGTTTTTTA TAAATGGGGC CGTATCTACA GAAGCTCGGG GTAAGGGAGG GGACATACTT 
ATGCCTGAGA CACGTGTATT TTTCTTCACG GCGTTGTTAA CAATTTATGC AACTGTCTAT 
ATGGGCATTT CTACTTTTAC GCCACTTCGT TTAAAAGACG AGGGGTTGCC AATAACCTAC 
TGGGGTCTTT TTTCTTCAAT TGCAGCAATT TCTAGCCTAA TACCTCGGGC TTTTTTACTT 
AGGATGGGGT TTGTTAATTA TATTACTGCC GGACTTGCAT CTGCTATAAC AATGGCTGGT 
TTAGCGCTTG TAGCTGTGGC ATGGGATCTA CCTCTTTTTT CAGTGGCCGG GGCGATATAC 
GGCCTGGGGC AAGGCGCCGT TGTTGTTACA TATCAAATAT TGGCTCTTGC TGGTAGTAGA 
AACGCAGGTC TTGCTAGTGC TGTTTATACC ATGGGTTGGG ATTTGGGGTC GATCATTGGG 
CCAATTTTTG CAGGCGTGCT AGTAGAACAT TTTGGCTATG GCGTTTTATA CTATGTGCCA 
CTACTTCTTT TAGCAAACAT GGGGACTCTG TTTATATATG CATTACATAA GCGGAAAATG 
TGA

Protein sequence

MRINFATLLF FIANGIVVVA IPPYLRDLGV ISESTIGTII STAFFVSVIV RPLSGFIGDK 
VGYVKVMRIG VVFAVMSQIM YLLSNPLWVQ IGRVFHGFAI GTFLPMSIAI SVTEGAKAMA 
TRSLAVGIGN VVGPLIGSIL YDLGGGRLSI TVALLLHTIN WFFINGAVST EARGKGGDIL 
MPETRVFFFT ALLTIYATVY MGISTFTPLR LKDEGLPITY WGLFSSIAAI SSLIPRAFLL 
RMGFVNYITA GLASAITMAG LALVAVAWDL PLFSVAGAIY GLGQGAVVVT YQILALAGSR 
NAGLASAVYT MGWDLGSIIG PIFAGVLVEH FGYGVLYYVP LLLLANMGTL FIYALHKRKM