Gene CNB03380 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNB03380
Symbol
ID	3256057
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006684
Strand	+
Start bp	1017221
End bp	1019091
Gene Length	1871 bp
Protein Length	408 aa
Translation table
GC content	45%
IMG OID	638254982
Product	expressed protein
Protein accession	XP_569023
Protein GI	58263226
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.203018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTTATTATTA CTGAAACATA TTGACCATCT GATCAGCTAA ATGTGAAATA TGGAGCAGGA 
GGGGAAAAAA GACAAGGCTG AAGAATATGA TGGTTAGTTG TGTTCGTAAT GGTTATTTAC 
TACTCATTCG GATTTTGTCT GAAGTATGCG TGGAATCTAG GCACTCAAAT CTCAAACAAA 
GATCGACGAT GATTTAACGT TCTGTGTTGA TCCGATGTTT ATCGGGCCAA GAAGATTGCG 
GGACTTCACC TGCTTTGAAG ATCTAGAGCT CTGTGTTTAG CGTGCGTGCT CTTATAAACC 
TTCTCGCATA GCCCAGCACC CATCAATTTC CAAGTTTAAA CAAACACAAC GGCACTTCCT 
ATTTGTCTTT TAAAACATAT TCTGTCCTAT CGTCAGTGCA CGTTATCCCA CAGCCACTAT 
GCCGGATCCT AATTGTCACT CTCCCAATGA CACAACACCT CTCCCGACTT CTTCAGTATC 
GTTCAGCGAT ACGAGTGATT ATTCCCCAAC GAGCTCTGTT ACTTCATCCG AAATGAGGCT 
GTCAGATCAG TTACCTTCTC CTAAATTTGC CACGTCTCGC GGCTTCCCAT TACTACCACC 
AAGTCACCCC TTGCGCGCTC AACTATGTAC CCAGGTTGAA GGAGAAATGA GCCCACCTAG 
AACACCTAAG GGACATCCTA TAGATCAACT GCCAAATTCT TACTTTCCGT TCCCCCCCTC 
AAAAGCAATA AAAGTAAGTT CCCTTTAGTT TCTTTGTTTG AATCACCTTT CCACAATCAA 
CGGGGAGACG TCATGCTAAT ATAGATTTAC TATTAGCACA GGAGTCAAGG TATCGCCAAT 
CCATATGGTA GCGATAACCC TTCGTATCCG GTTGGTATCA CCTATTTGCT TCGTATACCT 
CGAAGGCTCC GTCCATACCT CTTGGTCTCC TTCTGCCTCT TCATTTTCGG ATTCATCCTC 
GTGAACAGAG CAGTGTCAGT TTCTCAGGGC ACACGCGCTG TTACTATGCA AAAGCATTTC 
AGCCACTCAA CGCACAAATA CATACCGATT GACAGGCTAT ATGGAACCAA TGACGGAAGT 
TCATACCTTT TATCAAGTCA ACGGGCAACA GAAGCAGGTA TCGCGGAGGT GAATGCGCGA 
GCTAGAAAAA AGGATGCCGA GCTTTTCAGG TTTGAGTCAA TGGAAGAAGA ACTTGCTGCT 
TTGATTTCAG TGAGCTTAAA GCCATGAGTC GCCCGATGGG AATAAAAACT TATGTCGGCC 
GATAGTTTGT CACTTCTACT ACCTCAAATG TCATCCCTCA ACTTGATCCA TCGGTCCCAT 
TAGACCCCTC TGTTATTCTC GACTTCGACC CTTCACACCC AAATGCCCGA GACGACCTTC 
TTCTTTTGCA GGCGGAAATT AATGCTGTGT ATCCTCTGGT TCTTTTTGGG AGGATGCGCG 
ACCCTCATCA CAGGGCGATC AAGCGCTTAT TATCGGAAGT CAAAATAACA CCCGCCCCTC 
TTGTTATCGA AGTCGATCAG CGCAAGGATC GCAAAGTCTT CATACCAACT GTGGCAAGAC 
TACTGGGGGA TGAACTTCCC GTCATAACCC TACAAGGCAA GAGGCTGGGG GGTTATAAGG 
AGATAATGGC AATGCACGAG GCGGGTACCT TGAATGACCG TCTCCAGAAA GATGGAGCAG 
TACTGGTGAG AGAGATAAAG AAAAAGAAGA AGGGAGCTAA GGAACAAGAG AGAATGGAAA 
ACGAAAGAGT CTTGGGACCG GCGCCAGTTG TAGATGATGA ATAAGTTAAG GATTAAGAGA 
TATTGCACGA CTGACAACGA GTGTTTCTGG TCATCTTATG TGTGTAATTA TATATATTTT 
TTATATATTG C

Protein sequence

MPDPNCHSPN DTTPLPTSSV SFSDTSDYSP TSSVTSSEMR LSDQLPSPKF ATSRGFPLLP 
PSHPLRAQLC TQVEGEMSPP RTPKGHPIDQ LPNSYFPFPP SKAIKHRSQG IANPYGSDNP 
SYPVGITYLL RIPRRLRPYL LVSFCLFIFG FILVNRAVSV SQGTRAVTMQ KHFSHSTHKY 
IPIDRLYGTN DGSSYLLSSQ RATEAGIAEV NARARKKDAE LFRFESMEEE LAALISFVTS 
TTSNVIPQLD PSVPLDPSVI LDFDPSHPNA RDDLLLLQAE INAVYPLVLF GRMRDPHHRA 
IKRLLSEVKI TPAPLVIEVD QRKDRKVFIP TVARLLGDEL PVITLQGKRL GGYKEIMAMH 
EAGTLNDRLQ KDGAVLVREI KKKKKGAKEQ ERMENERVLG PAPVVDDE