Gene CNM01740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNM01740
Symbol
ID	3255175
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006682
Strand	-
Start bp	524470
End bp	525901
Gene Length	1432 bp
Protein Length	255 aa
Translation table
GC content	46%
IMG OID	638254328
Product	hypothetical protein
Protein accession	XP_568312
Protein GI	58261804
COG category	[R] General function prediction only
COG ID	[COG1011] Predicted hydrolase (HAD superfamily)
TIGRFAM ID	[TIGR01549] haloacid dehalogenase superfamily, subfamily IA, variant 1 with third motif having Dx(3-4)D or Dx(3-4)E

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGTTA TCGATCGATG GGGTAAAGGT GTTTAGGTGT GAAACATGTG CTATGCACAC 
CATATCGATG TAACTAGACT ATGTTTTTCG TATTGACAAG GACAAGAATC TTAACCACGA 
TTCCGAACAT TAGAAATATG GCCTCATCAA CGAATTCGAA ACCGGTTCGC TTGGTTCTCT 
TTGACGTCTT TGGTGAGTCT AGTCCAATCA TAGAACGACG TAGGAGGCTC ATCCATACAA 
ATGATGACTA GATACCCTCT GTACTCCAAG GCTACCCATC CACGAACAGT AAATCTCATT 
ATTTTTGCTG CATACGCTTC TCGCGTCTGA CTTATGCGGC AGGTACCACG AAGAAGCTAT 
CAGAGGTGGG CTCTCATCTG CAAGTATAAC CCCACAGAGC GTCCGTAATG CATTCAAACC 
CGGTATATCT TCTTTTGGAC TAATTGAGAT CGACTAAACT GACTGTCGGT TCAGCCTTTA 
AAACTGTCGA TGCCCAATAT CCTTTGTATG GTAAACATTC GACGCCTCCA TTGACTCCTG 
AGGAATGGTG GACAAGAATC ATCTATGAGA CCCTTAGGGA AGCCGGAGCT TCCAAGCGAG 
GTGAGTTATG ATCCTTTCGC TAATTTCCAT GTAGTAGCTA TGACTGACTC AGATGATTCT 
GCTGTCAGAA TTGGATGGGA AGATTGATGC GATCGGACCT GCTTTGATGA GTCGTTTTGA 
GAGTGATCTC GGGTATCGAA ACTTTCCAGA GACTATCGCT TGCCGTAAGC TCCCAGCTCG 
TTGTTTGATT TGAATCCTTG GACTAATACT AGGCTAGTAA AAGAGCTTAA GGAGCTAGAA 
ATCAAGACCT CGGTAGTATC CAATGCTGAT CCTCGTATTC GTGAGCATCG AACTCTTAGC 
CCGGGCCTCT TCTCAAATTC ACCTATGATT CGTAGTCAAA ACCTTGGATT CACTTCAGAT 
CTTACCCCTT CTTACCTGTT CTCCCACCCT ATCATGGGAT GTCGAAGCTG CCAAGCCATC 
TGCTACCATC TACGAGAAAG CATGCGAGAT ATCTGATGAA AAAGTGGGAG AAGGTATCAT 
CATGGTTGGC GACGAACTCA AAGCGTAAGC CCATATTCCA TCAGGTCAAT GGCGAATGAC 
TATTGAAGCC TCATGCTGTT CTAGTGATTT CCATGGTGCC ACGTCGGCTG GGATCGAGGC 
TCGTCTTATA CGGAGACCAG GAGAATGGAG TGATGGTGCT GTCAGAGATG CTAAAGAGGA 
ATTGGGCGGG GTGAACGTCG TTTCTAGCTT GGAAGACATT GTTAAAGAGG TCAAGCAAAG 
GAACGTAGGT GGCTGAGGTA CAGAGGTGTA TACTACGAGT CTGTGGTCTC AAAGGTCAGC 
ATGACAGCTA CTCGCAATTG GACCTCCTCG GGATAATCGG CAGCACAAAT AG

Protein sequence

MSVIDRWGKE IWPHQRIRNR FAWFSLTSLV PRRSYQRWAL ICKYNPTEPF KTVDAQYPLY 
GKHSTPPLTP EEWWTRIIYE TLREAGASKR ELDGKIDAIG PALMSRFESD LGYRNFPETI 
ACLKELKELE IKTSVVSNAD PRILKTLDSL QILPLLTCSP TLSWDVEAAK PSATIYEKAC 
EISDEKVGEG IIMVGDELKA DFHGATSAGI EARLIRRPGE WSDGAVRDAK EELGGVNVVS 
SLEDIVKEVK QRNHK