Gene CNF03490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF03490
Symbol
ID	3258404
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	+
Start bp	1033529
End bp	1035382
Gene Length	1854 bp
Protein Length	489 aa
Translation table
GC content	48%
IMG OID	638257467
Product	splicing factor u2af-associated protein 2, putative
Protein accession	XP_571423
Protein GI	58268534
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAGCT GTACGCCGAC GAACCGCAAA TCCTTGGGTA TACTGTAGCT CTAGGTGATT 
TCTGGGTCTT ATGTGTTCGT TCTTTTTTGT ATATGTTTTT TCTCCCAGGC TACATATCAG 
CCATGCTGAC GGAAGAGATG ACCAATCGAG TAGATCCGGA GAGCCAGTGG AGTGAATTCT 
TTACGTGACG GAGAAAAGTG ACTGACGAGT TGACGAGGCG AAGGAGGGAG CCGTCCCACG 
TGCGCTTGGC GTGGATCTCG CGTGGCTTAT CCTACCACCG TCATGGCCCT CAAGCCGTCG 
CGGACCAGAA GCAATCGAAC TATCCGTTGT TCGAGTCTCT TCAGTTATTG AGCTGTCTAT 
ACGTTTACGT GCCACCATTT GGTAAAATGC CAAACGCCCC CATACCCGGC CAGTTCGAGC 
AGGACACTCG AGTCTCTTTT GACAAAGTTT CCGGCAAGTG GCAGTACGAA GATGATGAAG 
GCACAGAACA TGAATGGAAT GGCACTGCTT GGATTCCCAT TGTACGTATC ATGCAGACTC 
GTACCAAACA AAGGCTGATC CATCTGTCTA GATTGACGAT GAGCTTGTAA GAGCACAGCA 
AGCAGCGTAC TCGGTACCCG GTGTAGACGA ATCAGTACGT CGGTTATCAA TCGTAAAAGA 
ATTAAATCCT CATCAACCGA TTGATAGACA CCTTCCAATG CGGCCATCGC AAGAGAAGAA 
CGCCGTAACA AGAAGCGTAA GAAGGGAGAA AAGGATTATA CCTCAAATAC CTCCAACGCC 
CCAGCTGCTG CGACCGAGGC CTCCAAACCT GCTCCTGCCC CGTCTGCGCC CAAGAAGACT 
GGTGTTTGGG TCACAAATCT TCCGCCAAAC ACCACTATCC AGAAGCTTGC CGATGTCTTC 
TCCAAGGCTG GCGTCTTGCA TATTGATGAT GAAGGCAATC CCCGTATTAA GATGTACTAT 
GATGACGAAG GGAATTTCAA AGGCGAAGCT TGGGTTGTAT ATTTCAAGGA AGGCAGTGTG 
GACCTCGCCA TCACACTTTT GGATGACACT GAGCTCGAGC TGGGTGCTGG TTATCCGCCT 
ATGAGAGTCA AAGTCGCGGA ATATTTTAAA GATCAGGAAA AGGGAAAAGA TAAAGAGAAG 
AAAGAGAAAA CTGAAGGAGA AAAGAAGAAA TTGACGGCCG AAGAGAAGCA AAAAATGAGC 
AAGAGGATGA AGACTCTTCA GAGGTGCGTG ATTAGTTTCT TATGATCTTG ATCTGGATTG 
GACTGATTGT ATGTAGTAAA ATCACGTGGC GCTCGGATGA TGAGTCTGAC GACCCTGCTG 
CTCCTCTCGG AGGTGCTCCT GCCCCGACAA ACAACCGTTT CGCTCGTGTG GTCGTGTTGA 
AGGGAATGTT CGTCCCCGAG GAATTAGAAA AGGATCCTGC GTTATTGCTA GAGCTGAAAG 
AAGAGGTCAG AGAAGAAGCA GAGACGCTTG GCCAAGTCAC GAGTGTTATC TTGTATGATG 
TAGGTTACTA CATCTTGACG GCTGATTTCG ATGCTTACAA TGAACCATAG AAGGAGGAGG 
ACGGGGTAAT GACCATCAAG TTCAAGGAAC CCGTGTCAGC GCAGGCGTGT GTAGCGAAGA 
TGAACAACCG ATATTTCGAC GGTCGAGTGG TATGTCTGGC TTATGATCCT TTTTCTAATG 
TCGCTAACAC ATTCAACGCA GATCTACGCC GGTCTCTATA ACGGAAAGGA AAGATTCAAA 
AAATCTGGTG GACGGACGTT TGATGAAGAT AATGATCAGG AGGAGAAGGA GCGACTGGAC 
AACTTTGCGC ACTGGCTGGT GGAGGGCGAG GATGAAGAAG CTGCCAAGAA GTAA

Protein sequence

MASCYISAML TEEMTNRVDP ESQWMTDELT RRRREPSHVR LAWISRGLSY HRHGPQAVAD 
QKQSNYPLFE SLQLLSCLYV YVPPFGKMPN APIPGQFEQD TRVSFDKVSG KWQYEDDEGT 
EHEWNGTAWI PIIDDELVRA QQAAYSVPGV DESTPSNAAI AREERRNKKR KKGEKDYTSN 
TSNAPAAATE ASKPAPAPSA PKKTGVWVTN LPPNTTIQKL ADVFSKAGVL HIDDEGNPRI 
KMYYDDEGNF KGEAWVVYFK EGSVDLAITL LDDTELELGA GYPPMRVKVA EYFKDQEKGK 
DKEKKEKTEG EKKKLTAEEK QKMSKRMKTL QSKITWRSDD ESDDPAAPLG GAPAPTNNRF 
ARVVVLKGMF VPEELEKDPA LLLELKEEVR EEAETLGQVT SVILYDKEED GVMTIKFKEP 
VSAQACVAKM NNRYFDGRVI YAGLYNGKER FKKSGGRTFD EDNDQEEKER LDNFAHWLVE 
GEDEEAAKK