Gene PICST_43145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_43145
Symbol	NTA1
ID	4837831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	+
Start bp	887916
End bp	888989
Gene Length	1074 bp
Protein Length	357 aa
Translation table	12
GC content	42%
IMG OID	640389146
Product	Carbon-nitrogen hydrolase
Protein accession	XP_001383452
Protein GI	126133855
COG category	[R] General function prediction only
COG ID	[COG0388] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.186344
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGT TCGCCAGGCT CAGGGTGGCA TGTGTTCAGC TTAACCCGAG AATAGGTGAG 
GTTGAAGCCA ATATTCGCAA GGTACACACA ATACTAGTCA ATGTACCGAA AGTAGATTTG 
GTAGTACTTC CGGAATTGGC TATAACGGGC TATAACTTCC CCAACCGTAG AGCAATTGAG 
CCATATCTAG AGAATTTGGC CCTAGAGAAT GGACCCTCTA TCAAGCTAGC AAAGGAAATC 
TCAAACAAGT ACAAATGCTT TACTTTGATT GGATACCCTG AAATTTCGAA TTCAACAATT 
TATAACTCTG CCGTATTGGT AGGACCCAAC GGCTCAATAC TACATAACTA TAGAAAGACA 
TTTCTCTATG AAACAGACGA GGTATGGGGA GCAAGTGAGA ATCCAGAAAA AGGGTTTTCG 
TCTCTAAAGC TTGTACTTGA TAAGGAATAC TATTTGGACA AGCAGGCAAA CAAAACATAT 
CCAACTGTAA CTACAAACAT CGGCATTTGC ATGGATGTAA ATCCCTATCA ATTCAAGGCT 
CCGTTCAATG CGTTTGAATT TTCAGGCTCG GCATTCCACC AGAGAGCCAA GCTCCTCTTG 
TTTCCCATGG CATGGCTATC GCCCCAATCA CCTTCAACTA AGGAAGACTT GACCAAGAGT 
GAGAAGTTGA ACAAGGGCAA GATATTCAAT GAAAGGTACT TCTCCACAGA ACATAAACCA 
ACGGTAAATG ACAATAACGT AGCCCCAAAG TTGGAGTCTA ATACTTTATT CGTGCCTACA 
ACTCCAGAAG GTAGCACAGT AAACTACTGG CTTCTCCGTT TTTTTCCATT CATGAAGCAT 
CCCAACAGTT ACCAGTCCAA ATACTATGAG ACTGCCACGC TTATAGCCTG TAATCGTGTA 
GGGGTGGAAG ACGATATATT GTATACTGGA TCGTCATCAA TAATACAATT CTCTGGAACT 
TCATCTTCGG CTCCTCAAAT TGATAGTGCC AACCCCAGCG TTAATGTGCT TGGGAGTTTG 
GGCCAAGGCG ACGAGGGAGT TTTAGTAAGG GATATAGATA TCGAATTTGA CTAA

Protein sequence

MNKFARLRVA CVQLNPRIGE VEANIRKVHT ILVNVPKVDL VVLPELAITG YNFPNRRAIE 
PYLENLALEN GPSIKLAKEI SNKYKCFTLI GYPEISNSTI YNSAVLVGPN GSILHNYRKT 
FLYETDEVWG ASENPEKGFS SLKLVLDKEY YLDKQANKTY PTVTTNIGIC MDVNPYQFKA 
PFNAFEFSGS AFHQRAKLLL FPMAWLSPQS PSTKEDLTKS EKLNKGKIFN ERYFSTEHKP 
TVNDNNVAPK LESNTLFVPT TPEGSTVNYW LLRFFPFMKH PNSYQSKYYE TATLIACNRV 
GVEDDILYTG SSSIIQFSGT SSSAPQIDSA NPSVNVLGSL GQGDEGVLVR DIDIEFD