Gene PICST_31390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31390
Symbol	CHT4
ID	4838457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	+
Start bp	676543
End bp	677766
Gene Length	1224 bp
Protein Length	407 aa
Translation table	12
GC content	42%
IMG OID	640389772
Product	chitinase endochitinase 1 precursor
Protein accession	XP_001384092
Protein GI	150865042
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3325] Chitinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.888541
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.285609
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTACACA AGCTCTCTTC TAAAGTGAGC GACAGAATTC ACAAGTACAA TCTGCTCAGC 
CAGGATAAAA ACCAACAGGC CTTTCAAATT GCTGGAAAAG ACGATTGCAA AGGGTATAAA 
TCATGCGTAT ATTTCTCAAA TTGGTCCGTC TACGGACGTA AGCATTTTGC CATAGATATA 
CCTGTAGAAT TTGTGACTCA TGTCTTTTAT GCTTTCATCA CTATCGATGC CAATACTGGA 
AATGTCAAGT TCACAGACGA GTGGTGTGAT CTCCAATTGC CGTTGGAATC GCCTGTAAGT 
TCCAATCAGA AAGTCACTGG TTCAATTCAG CAACTTTTCC AGATGAAGCA GCTTAATCGT 
CATCTCAAGG TGGTGATGTC AATTGGAGGC TGGGGGACTG AACATTTGTT CCAGGCTGTG 
ACGAGCGATC ATGCGAAGCT AGACAATTTT ATCAATAGTG CTGTGAAGTT TGTTTGTGAA 
TACGGTTTTG ATGGAATTGA TATCGACTGG GAGTATCCTC GCAATACCCA TGAATGTAAA 
CAGCTTGTAA AGTTACTTTC AGGATTGAAG CAGAAGTTGA ACCTCGTGTC TCCAGATTAT 
TTGCTTACAA TTGCCTCACC TGGGGGCGAC GAAAATATTG AAGTTTTGGA CTTTCCAGAG 
TTGGACAAGT ATCTTTCGTT CTGGAACGTC ATGTGCTACG ACTTCTGTGG AGAGGGCTGG 
TCAACCAGAA CGGGGTATCA TTCCAACTTG TACGGCAATA ATGGGGATAA TAACTTGAGT 
GCTAGTAACA TCATTGAAAA GTACATTCAG CATGGAGTTT CTCCACAAAA ATTGATTCTT 
GGTATGCCAT TATATGGACG AGTATTCCAT GGAGCTCTGT CTCCGACTGT AGGTCATTCT 
TTCACCAAAG AAATACTTCC TGGCTCTGTA AATGGTGATA CTTGTGACTA TAAGCTGTTG 
CCTATTAGTC AGGAGAGTTT TGATGAAAAG ACGGGAAGCT GTAGCTACTA CGATAGCCAA 
ACGAAACAAC TCTTTGTCTA CGATAATCCT CAGGTGGCTC GGATGAAGGC TGATTTTACT 
AGTAAGTATA AACTTGGTGG AGGCATGTGG TGGGATTCAT GTGGAGATGT TGCTATCAAA 
GAAAAGGAGA GATCTCTTAT TTATAACTAT ATCCAGCAGC TTGGGGGTAG TGCAGCATTA 
GAGAAGACTC CCAACCATAT CTAG

Protein sequence

MLHKLSSKVS DRIHKYNSLS QDKNQQAFQI AGKDDCKGYK SCVYFSNWSV YGRKHFAIDI 
PVEFVTHVFY AFITIDANTG NVKFTDEWCD LQLPLESPVS SNQKVTGSIQ QLFQMKQLNR 
HLKVVMSIGG WGTEHLFQAV TSDHAKLDNF INSAVKFVCE YGFDGIDIDW EYPRNTHECK 
QLVKLLSGLK QKLNLVSPDY LLTIASPGGD ENIEVLDFPE LDKYLSFWNV MCYDFCGEGW 
STRTGYHSNL YGNNGDNNLS ASNIIEKYIQ HGVSPQKLIL GMPLYGRVFH GASSPTVGHS 
FTKEILPGSV NGDTCDYKSL PISQESFDEK TGSCSYYDSQ TKQLFVYDNP QVARMKADFT 
SKYKLGGGMW WDSCGDVAIK EKERSLIYNY IQQLGGSAAL EKTPNHI