Gene CNH03030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNH03030
Symbol
ID	3259185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006693
Strand	-
Start bp	252199
End bp	254199
Gene Length	2001 bp
Protein Length	621 aa
Translation table
GC content	54%
IMG OID	638258182
Product	hypothetical protein
Protein accession	XP_572473
Protein GI	58270634
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCCGCA CTTCTCGTCT CATCCCCTTG AAGAAGGACG ATGGCTCTAT CCGACCTATC 
GCTGTTGGTG AACTTATCTA TCGGCTATGT GCGAAAGCTC TCATCATCTC GCATTTCCAA 
CCCGACTTCC TCCTCCCGTT CCAGCTCGGG GTCAAGTCAA TCGGTGGTGT AGAGCCGATC 
GTGAGGCTGA CAGAGAGAGT CTTGGAGGGT TCTGCCGGCG CTGAGTTCTC CTTTTTAGCC 
TCGCTCGATG CTTCTAACGC TTTCAACCGT GTAGATAGGG CCGAGATGGC AGCTGCGGTC 
AAGACCCATG CGCCGACGCT TTGGAGGACT TGCAAATGGG CCTATGGCGA CTCGTCCGAC 
CTTGTGTGTG GCGACAAAAT CCTTCAATCC TCTCAAGGTG TTCGACAGGG TGACCCCTTT 
GGCCCTCTCT TCTTCTCAAT CACCCTCCGA CCAACCTTGC ACGCCCTCAG TCAATCGCTA 
GGTCCGTCTA CGCAAGCGCT CGCTTATCTC GATGACATCT ACCTCTTCTC AAACGACTCG 
CAAGTCCTCA GCAAAACTAC CCAATTCCTC GCCGACAAGC AGCACATCAT CAAGCTCAAC 
GAAAAGAAAT GCAAGTTAAT CAGCTTCGAT GAGATCAGGC AGGAGGGCTT CAAGATGCTA 
GGGACGATGG TAGGTGGTAA GGAGAAGCGG GCGGAGTTTC TGGAAGGCAG GATTCGGAAG 
GAAATGGCAA AGGTGGGCAA GCTCAAGGAT CTTCCACATC AACACGCGCT CCTTCTATTA 
CGGTTCTGCA TCCAGCAAAA TCTACGACAC CTACAGAGAA GCCTACGCTC CGACGACCTT 
GTAGATCTAT GGGAAAGACT GGACACGATG CTGTGGGAGG AGGTGAAAAG GATGAGGATG 
AGGCAGCGAG AGGATACAGT GGAAGAGGAG ACTCTAGGGA GATCGTTGAC GAAGCTACCA 
GCGCGACTGG GCGGACTAGG TCTACTTTCC TTCAAAGATG TAGCCCCCCT TGCTTACCGC 
TCGGCAGCCG AGGCCTCCGA CACTCTCCTC GATAACCTAG GTCTCCTTTC TTCGCCTGAG 
GAACCTCCAA CTCCGGTCCC CCAACGAACT CGATGCGCAG AACTCTGGGA ATCGCAACAG 
GAAGCCATTC TACGTAATCT CGGCGACACC GAACGCAAGC GACTCACCGA GAATGCCTCC 
AGACTCGGCC GAAGTTGGTT ATCAGTCATC CCTTACCTTC AGCCCCTGCG CCTTTCCAAC 
GTCGAGATTG CCTCGGGTCT CCACGACCGC ACCCTGGTCG GCTCCTCGAT ACCTGTCTGT 
CGCTTCTGTG GGTCGGACTC ACCTTTGGGT CACGACGAGC TTTGCCGCGC CCGCAACCCC 
TGGACCCAGC GCCGGCACAA TGCCATCAAC CGCGTCATCT ATCAACACCT CAAACAAATC 
CAAGGTGCCA CGGTTGAGAT TGAGCCCCAC ACGCTGTCGG GACAAAGGAG AAACGACCTT 
CGGGTCAGAG GTTCCAGCGC GTTGGCCTTC ACTGACTACG ACCTGAAGGT ATACTCCCTC 
GGAGACCGAG ACGCGAGAAG CACCGTCACA CCCTGCGCCC CCAACGGCAA GCTAGCCGAC 
TTCTGCTTGG ACCGGTGCGT GAACTGGCTC GACAAGGTGG GTCAGGTCGT CTCGAAGAAC 
GCTCCGAAAG TCACTGGTGG GGTCTTTAAA CCGATCATCC TTTCCACTGG TGGCCTGATG 
AGCAGGAGCA CAGCAGACGA ATGGAAGGAG TGGAGGGAGG CGATGCCGGT GGGGGGGTTC 
GAGAAAATGG AGAAACGGAT TGGTGTCGAG CTAGTAAAGG CAAGGGCGAG GACGCTGGTC 
TTGTGAGGAA GAGGAGGTTG GATTATTTTT TTTTCTTTTC TTTAATAAGT TGTTTATTTA 
AGTAGTTTCT TTCATTCGGG TAACACACAC GACAACCCAA TAAATTAAAC AACGAAAAAA 
TGCAACCTCT ATAACCCCCT A

Protein sequence

MLRTSRLIPL KKDDGSIRPI AVGELIYRLC AKALIISHFQ PDFLLPFQLG VKSIGGVEPI 
VRLTERVLEG SAGAEFSFLA SLDASNAFNR VDRAEMAAAV KTHAPTLWRT CKWAYGDSSD 
LVCGDKILQS SQGVRQGDPF GPLFFSITLR PTLHALSQSL GPSTQALAYL DDIYLFSNDS 
QVLSKTTQFL ADKQHIIKLN EKKCKLISFD EIRQEGFKML GTMVGGKEKR AEFLEGRIRK 
EMAKVGKLKD LPHQHALLLL RFCIQQNLRH LQRSLRSDDL VDLWERLDTM LWEEVKRMRM 
RQREDTVEEE TLGRSLTKLP ARLGGLGLLS FKDVAPLAYR SAAEASDTLL DNLGLLSSPE 
EPPTPVPQRT RCAELWESQQ EAILRNLGDT ERKRLTENAS RLGRSWLSVI PYLQPLRLSN 
VEIASGLHDR TLVGSSIPVC RFCGSDSPLG HDELCRARNP WTQRRHNAIN RVIYQHLKQI 
QGATVEIEPH TLSGQRRNDL RVRGSSALAF TDYDLKVYSL GDRDARSTVT PCAPNGKLAD 
FCLDRCVNWL DKVGQVVSKN APKVTGGVFK PIILSTGGLM SRSTADEWKE WREAMPVGGF 
EKMEKRIGVE LVKARARTLV L