Gene CNC04850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNC04850
Symbol
ID	3256119
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006685
Strand	+
Start bp	1468599
End bp	1470080
Gene Length	1482 bp
Protein Length	423 aa
Translation table
GC content	48%
IMG OID	638255704
Product	conserved hypothetical protein
Protein accession	XP_570018
Protein GI	58265724
COG category	[S] Function unknown
COG ID	[COG5542] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGCTTACCAT CATTGCCCCT TCCCGCAAAA CATGCCTCAG CAATGGCGAA GCTGTCACCT 
CTCACTCTGA TCTTCATCGC TGCCTGTCTT TCACGCATAC TTCAACTCAC AATCCTCTCT 
GGCCTCAGCA AGGCTCTGCC TCTGTTCGAT ACATCACCAT CTCTCCTGCT CTCTTCCCCA 
CCACCCGCCT TACGATGGGA TGCTATTCAT TTTGCGTCTG TAGCTTACAA TGGGTACGAA 
TATGAGCAAC AGGTCGCTTT TCAGCCAGGA TGGCTTGCCG TGATGCGACT GGCGGGCGAG 
GGTGTGAGGT TTATAAGGGC AGCATCAGTC GTAGAACTGA AGGATGTGAT ACTGGGAGGC 
ACAATCGTGG CTAATGTTGC CTTCGTGGCT GCGACCTTGG TGCTTTACAA GTAAGCATGG 
ATTTCAAGGG GTACGGCGTA GCTTATGCAC ACCGTGTAGA CTGACGAAAC ACATCTTCAA 
CCCAACGTTC GCATTTCTTA CATCCCTACT CTATCTCCTA CCGCCCACGG CCACTCCTTC 
AGCACCCTAT ACAGAACCTA TCTACTCTCT TCTGACATTC TCAGGCATCT ATCTTCTGTC 
TATCAAGCGA CAAATGGTAC TTGCTGGTCT TTGTTTTGCA GGGGCAACCA CCATCAGGTC 
CACTGGCATT TTCAACTCAA TCACGCTCAT GTGTTTCGCT GTTTTCGGTG ATGCACACAT 
ATTCGATCTC GACCCTAAGG ATTACTGTAA GGTGAGGGGT GTCTTGTTGA GCTTTGGTGC 
AATATTTACT GACTCTTATT AGATTCGTAA AAAATTGAAG CCTTTTCTGT CGGCAATCCT 
CGTGGTCGCG CCATTCTTCA TGTTCCAGCA TTACACTGAG ACTGTATTCT GTACGAGAGA 
ATTGAAGCGG GCAAGTACTG CTCGTCCATG GTGCAGTAAC AGCCCACCAG TGTCTTATGG 
TTTCGTTCAA AAGCTGTACT GGTAAGTGTA CATATTTTCA TTCAATTTTG ATATGCTAGC 
TGAGGATGGG AATTTTAGGA ATGTTGGACC GTTTGAATAT TGGACAGTGT CTCAACTTCC 
AAACTTTGCA CTGGCAATGC CTATCCTTTT TTTCTCCTTG GCCGGCGTCG TCAAGTTCTT 
CTCCCACTTG GTATCTTCCT CTCAAGTTCT TAATCACGGC ACTGAAGAAA TCCCACCGCC 
TCCTATACTA TTCGAGCTCT ATTCTGTCCA TGTTCTGACC ATGGCGCTGC TGTTATTCAC 
CAGTCATACT CAGATAACCC TACGGGTCTG CCTAGGTGAT CCCGTGGTTT GGTGGAATGC 
GGTCAAATTA GGATTTGACA ATGTTCAAAT TGGCGAGGCC CCCACGGGGC AAGTCAAGGT 
GAATAAGTTT GGAAGATACT GGATAGGCTG GACTGTGGTT TGGGGCGCAG TAGCTGCCGT 
ATTATGGGCA GGACACTACC CACCTGCATA GAAGTGTACC AA

Protein sequence

MAKLSPLTLI FIAACLSRIL QLTILSGLSK ALPLFDTSPS LLLSSPPPAL RWDAIHFASV 
AYNGYEYEQQ VAFQPGWLAV MRLAGEGVRF IRAASVVELK DVILGGTIVA NVAFVAATLV 
LYKLTKHIFN PTFAFLTSLL YLLPPTATPS APYTEPIYSL LTFSGIYLLS IKRQMVLAGL 
CFAGATTIRS TGIFNSITLM CFAVFGDAHI FDLDPKDYCK IRKKLKPFLS AILVVAPFFM 
FQHYTETVFC TRELKRASTA RPWCSNSPPV SYGFVQKLYW NVGPFEYWTV SQLPNFALAM 
PILFFSLAGV VKFFSHLVSS SQVLNHGTEE IPPPPILFEL YSVHVLTMAL LLFTSHTQIT 
LRVCLGDPVV WWNAVKLGFD NVQIGEAPTG QVKVNKFGRY WIGWTVVWGA VAAVLWAGHY 
PPA