Gene CNM01450 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNM01450
Symbol
ID	3255255
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006682
Strand	-
Start bp	422822
End bp	424575
Gene Length	1754 bp
Protein Length	425 aa
Translation table
GC content	47%
IMG OID	638254298
Product	conserved hypothetical protein
Protein accession	XP_568455
Protein GI	58262090
COG category	[L] Replication, recombination and repair
COG ID	[COG3145] Alkylated DNA repair protein
TIGRFAM ID	[TIGR00568] DNA alkylation damage repair protein AlkB

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TCTACCACGA CCAACACAGC TTGCTTTATA ATACATTTAA TACATCGCAA ATACCAAATT 
TCACTAGCAT GGAAAATGCC AGCTCCGCCT TAACCGCTTT CAGGCAAGCG GAGAAGCACT 
TCAAGAATCG AGCTAATAAA GATATCTACC CATCACTTCG TCAATGGCAA GACCGTTTGA 
TCGACTTGTC CCGGCCAGAT TCTCAAGAGG AGGATGAAAT ATGGGCCGCT GGGTGGTGGA 
GTCCTGATCA TGACGTTGTG CCAGCAGCTA CAAGTGGCAG ACGGAGAAAG GGGGTGGAAA 
AAAAGGATAA AGGGGAGAGA CCAGAGCTGG ATATCGCGAG TCTTGAATCT TTGTCTTTAC 
ACGGTGGGAA GACTGGATAT ATCGTCGCTC CAGGTGCGTG TGCCCCTCCC CATCTGAGAG 
ACCGCTGTAA CAACTTTTGT GACACAGGAT GTGTTCTTAT ACCTGGCTAC CTCACGGTCG 
AACAGCAACT TTCCTTCCTG CATGATTCCC TTGCCCGATA CACTCTCCCA CCTAACCCTC 
TCTCGCTTAG CACTCATTAC GATCTTCCTC CCAACCTTTT CTCCTTATTT GTCTCAAACC 
CGGAAGCGAC CGTTCTTCCG AAACACATGA CTGGCACAGT CAACCCCGAA GCACTTGCCT 
CCGCTTCCCA ACCAAAGAGC AGGAAATTGA ATGATACAGA ACCGGCATCA GTGATAGGGT 
ATGAAGAGAT TGTAGCTCGA AATAAAGCTT GGACAGGGGA TTTGCCTAGC GACAAGCTGG 
GAGCAAAAGA GGTGAGGAAG CTTTGGAAGG AAATTCGCTG GGCGAATCTG GGATGGGTAT 
ATCAAGTAAG TTTCATTTTT GTTGTCAATA GTCTGCAATG TAACTTTGCT CATCATCATT 
TGATTAATTA GTGGTCGACA AAATCGTATG ATTTCGCACC AGAAACCCCA ATACCTTTCC 
CCGCTCCGCT CGCCGATCTT TGCTCCGAAG CAGTAGCATC AGTGCCGTGG GAGAATGTGT 
TCTCTTCAGT ATCGGATCCA GACGCTTCAA CATATGGTTG GCAATCTTGG CCAAGAGATT 
ACAGTACGTC TTCTCACATT AATTGAATCG CTTTGAAATC AAATCTGACT TGTGGTGATA 
GAGCCTGATA CGGGCATTGT CAACTTTTAT CAGCTGAATG ATACACTCAT GGCACACGTC 
GATCGTGCAG AGTGAGTTTG ACAAACCCCA AAGAGTCACA ACCATCTTGC TGACCCATAG 
AAACAGACTA GATCCCGCTC GACCGCTGGT TTCAGTCTCG TAAGTATTCG GATCCATCCT 
CTCTCCCACT CTCTTCTCGC TGGTCCTCGT ATAACTAACT CCAATCCAGT TTGGGGCACG 
CTGCAATCCT TCTTTTGGGT TCTGACTCTC GTGATGAAGT CCCTAGACCG ATAATACTTC 
GTTCCGGCGA TATGCTGATC ATGAGCGGTA AAGGCAGACA GTCTTATCAT GGTAAGCTAC 
TTTTCTTAAA TACCTGTCTC CCCAGTCCTC TGGACCGTCC TGAAGGAAGA TGCTTATAAA 
CGCTATGCTG GACAGGTGTA CCCCGTATCC TGGAAGGGAG CCTTCCATCA CATTTCTTGG 
TACAGGAAAG TGACTCTGAG GAGATGAAGG CAGCGAAGAA TTGGATAAGT ACAGCTAGGA 
TTAACATCAA TGCTAGACAA GTCTTTCCAC CAGGTTTCAA AAGAGTAAAT TGACTAGCAT 
CACACATCCG AATA

Protein sequence

MENASSALTA FRQAEKHFKN RANKDIYPSL RQWQDRLIDL SRPDSQEEDE IWAAGWWSPD 
HDVVPAATSG RRRKGVEKKD KGERPELDIA SLESLSLHGG KTGYIVAPGC VLIPGYLTVE 
QQLSFLHDSL ARYTLPPNPL SLSTHYDLPP NLFSLFVSNP EATVLPKHMT GTVNPEALAS 
ASQPKSRKLN DTEPASVIGY EEIVARNKAW TGDLPSDKLG AKEVRKLWKE IRWANLGWVY 
QWSTKSYDFA PETPIPFPAP LADLCSEAVA SVPWENVFSS VSDPDASTYG WQSWPRDYKP 
DTGIVNFYQL NDTLMAHVDR AELDPARPLV SVSLGHAAIL LLGSDSRDEV PRPIILRSGD 
MLIMSGKGRQ SYHGVPRILE GSLPSHFLVQ ESDSEEMKAA KNWISTARIN INARQVFPPG 
FKRVN