Gene PICST_16494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_16494
Symbol	ARN2
ID	4840969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	747342
End bp	748994
Gene Length	1653 bp
Protein Length	551 aa
Translation table	12
GC content	40%
IMG OID	640392284
Product	Siderophore Iron Transport
Protein accession	XP_001386550
Protein GI	126140056
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000381637
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.145167
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GGTACTAGAA AGGCAGAATT GTTGAACGAG CAATACCAAT CTCCACACCT CAAGGTCTGT 
TTGTTCGTTT CTATTTTCTT TGTTGCTTAC ACCTATGGGA TCGAATCTAC TTTGAGAGGA 
AATATTCAAG CATATGCCAC TAGTTCATAC ACGCAACACT CTTTGTTGTC CACTGTTAAC 
GTTATCAAAT CAGTTGTTGC TGCTGCCTCT CAACCAATGT ATGCTAGGTT GTCAGATAAG 
TTCGGCAGAT TGGAGTTGAT GTTGGTCTCG ATTGTTTTCT ACATTGTTGG AACTGTGATT 
CAATCTCAAG CATTCGATAT TAACAGATTT GCTGGAGGTT CTGTGTTGTA CCAAGTTGGA 
TTTTCTGGAG TCATGATAAT GTTACAAATT ATATTGGCCG ACTTCTCAAA CTTGAATTGG 
AGATTAGTTT GTTCATTTGT ACCTGCTCTA CCTTTCATTA TCAACACATG GGTTGCAGCA 
GAAGTGCAAG CAAGTTTATT AGCCAACCAT TCTTGGAATT TTGCAATTGG AATCTGGGCT 
TTCATTTTCC CACTCTCATG CGTTCCTTTA CTTTTGTGCT TTATTCATAT GATATGGAAG 
GCACGTAAGA CAGATGAATG GCAACGGTTG AAGGAAGAAA GAACAAAGAC ACCATTCATC 
CAGAAGGCAG TCGAATTATT CTGGGAATTG GATGTAGTGG GCATTGTTCT CCTTGTTTGT 
GTTTTTGGGT TTATTTTGGT TCCTTTTACA ATTGCAGGAG GAGTCACAGA CAAATGGAAA 
GAAGCTTCTA CCTTGGCCCC TTTGATTATC GGATTTGCTC TTCTTCCTGT TTTCGTATGG 
TGGGAATACA AATATGCCAA GTTTCCTATT TCTCCTTTCC CGTTATTGAA AGATCGCGGA 
GTTTGGTCAG CTCTTATTAT TGCTATCCTA ATTGATTGGG TGTGGTACAT GCCAAATGAT 
TTTATGTACA CTGTCCTTAT TGTTGGTATG AGAGCTAGTG TCAAAGCTGC TACTAGAATT 
TCTTCCTTGT ATTCATTCGT CTCTGTCATT GTTGGCCCTC TATTAGGTCT CTTGGTCGTA 
AGGGTTAGAA GGTTAAAGGG CTTTATTATA TTTGGCACAA TTTGCTGGAT TATTTCCTTG 
GGGTTATTGG TACATTTCAG GGGTTCAAAT GATGGTCTTG AAAGTGAAAA GTACTTGGAT 
GGAGTTATTG GGTCTTTGTG TCTCTTAGGT TTTGGTGCTG GGTTCTTCAC TTATTCAACT 
CAAGTATCAA TTGAAACCGT TACCAACCAT GAATACATGA GTATTGTACT TTCACTTTAT 
TTATCCAGTT ACAATATCGG TGCTGCTATT GGTGCTTCTG TCAGTGGTGC CGTTTGGACA 
AATGAAATGT ACAAAGCTAT TGCAGCCAAT TTCGAAGAGG CAGGTTTTGA TAGTGAACTT 
GCGGCCCTCG CTTATGGATC CCCATTTGAA TTCATTAAAG AATATACATG GGGAACACCA 
GAAAGAATTG CTGTGGTCTT GGCTTATGCC AAAGTTCAGA GATATTTATG TATTTCTGGT 
CTCGTGTTGT GTTTCCCATT GCTTATGGCA ACATTTTTCT TGAGAGACCA CAGATTAGAC 
TCTGTTCAAT CTCTAGAATT GGACAATGAT CAC

Protein sequence

GTRKAELLNE QYQSPHLKVC LFVSIFFVAY TYGIESTLRG NIQAYATSSY TQHSLLSTVN 
VIKSVVAAAS QPMYARLSDK FGRLELMLVS IVFYIVGTVI QSQAFDINRF AGGSVLYQVG 
FSGVMIMLQI ILADFSNLNW RLVCSFVPAL PFIINTWVAA EVQASLLANH SWNFAIGIWA 
FIFPLSCVPL LLCFIHMIWK ARKTDEWQRL KEERTKTPFI QKAVELFWEL DVVGIVLLVC 
VFGFILVPFT IAGGVTDKWK EASTLAPLII GFALLPVFVW WEYKYAKFPI SPFPLLKDRG 
VWSALIIAIL IDWVWYMPND FMYTVLIVGM RASVKAATRI SSLYSFVSVI VGPLLGLLVV 
RVRRLKGFII FGTICWIISL GLLVHFRGSN DGLESEKYLD GVIGSLCLLG FGAGFFTYST 
QVSIETVTNH EYMSIVLSLY LSSYNIGAAI GASVSGAVWT NEMYKAIAAN FEEAGFDSEL 
AALAYGSPFE FIKEYTWGTP ERIAVVLAYA KVQRYLCISG LVLCFPLLMA TFFLRDHRLD 
SVQSLELDND H