Gene CNL04420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNL04420
Symbol
ID	3254885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006681
Strand	-
Start bp	223860
End bp	225123
Gene Length	1264 bp
Protein Length	273 aa
Translation table
GC content	50%
IMG OID	638253913
Product	conserved hypothetical protein
Protein accession	XP_567992
Protein GI	58261164
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5597] Alpha-N-acetylglucosamine transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CACCGCGATG TCTCCTGAAA AGCTCACCGA GGAAAATATC CTAGATCGTG AAGAGACAAA 
CATCCCGTCT ACCTCTTCAT CCATCCTTCC TGCCCCTATC TCCTACCCTG CGACGGTGTC 
CTACCGAATA GCGAACACAT GGTTGCGCCT GATTGCCAGC GGCATCATCG CCATACTACT 
GATCCATATC CTCCACATCC AGCTATCTCC AATGGAGGCG GTAGAGCCGG CCCCGCCAAC 
TCCGCCACCA GCGGCAGAAG CCTACGTGAC CTTCCTCGCG CATTCCGATG ATCCCAGACC 
ATGGTATTTC AACGCCGTGC GCAGGCTCAT GTTTCAGCTC AAATATGACC CCCTTACACT 
CGACCCACAC CCCAGAGATT TTGTGGTAAT CACCACACCA GGTGTCCCAG AATGGCAGCT 
CGAGCAGCTT CGTGAAGAGG GAGCTATCAT TGCCTCCCGT CCTTTGATCG ACCACCTCCC 
TCTTCCGGAA AAGGGAATCT CGCGCTACGC TGAAGTGTAC ACCAAGTTGT TCATTTTCAA 
CCTTACAGAC TATGAGCGCG TTCTCTTTGT TGATGCTGAC CAGTTGATGG TGAAGCCGTT 
GACTGGGATT TGGGATGATC CGAATGCCTG GCCGGAGAGC GGGATGGCTG CGTGTGGAGA 
GAGTAAGAGT GCCTGGGACC ATCCGACGCC GATCGAGGAT CAAAATTATT TCAATAGTGG 
TTTCATGTTG GCTAGGCCGG ATGAAAAGAC TTTCAACGAG TTGCTACAGG AGAAGGATTT 
CGACCCATGG TTTCCTGAAC AGGTGAGATT GGTCAGGGTT TTATCATAAT ATCCGAGCTG 
CCAGATCAAC TGCTGACAGC GTTATCGTAG AACTTGTTGA ATCATTACTT CCGGAGGGAT 
GGGCCCAGAC CGTGGAGGCC TCTGAATCAT ATGTGGGTTG TACCTTGACA TGTTTCAATT 
TGTCTACGTA TCACTTACAA GGGCTTTAGG TTTGTCACAA CCTTCCCAAG GAAAGTCGAC 
CTCGAAGCTG GTATCCATGT GTAAGCCCAG ATTGCAAAAT CCATTCATCC CAAGCTAATT 
TGGAATAGCC TCCATGACAA GATGTGGTTA CCCCATATTG ACAGGGAAGT CAAAGAAGTA 
TGGCGACAAA AGCTTGGGCG AATGGAAGGC TATTGGTTGG CGATGGGCCG TGGGCCTGAG 
GCTTGGAATT CTACTTCACT TACCTATATG TAGTAGATTT TGCCATTTAT TATATGTAGA 
ATGG

Protein sequence

MSPEKLTEEN ILDREETNIP STSSSILPAP ISYPATVSYR IANTWLRLIA SGIIAILLIH 
ILHIQLSPME AVEPAPPTPP PAAEAYVTFL AHSDDPRPWY FNAVRRLMFQ LKYDPLTLDP 
HPRDFVVITT PGVPEWQLEQ LREEGAIIAS RPLIDHLPLP EKGISRYAEV YTKLFIFNLT 
DYERVLFVDA DQLMVKPLTG IWDDPNAWPE SGMAACGESK SAWDHPTPIE DQNYFNSGFM 
LARPDEKTFN ELLQEKDFDP WFPEQVRLVR VLS