Gene CNL04980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNL04980
Symbol
ID	3254958
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006681
Strand	-
Start bp	397749
End bp	399725
Gene Length	1977 bp
Protein Length	558 aa
Translation table
GC content	50%
IMG OID	638253970
Product	homoserine O-acetyltransferase, putative
Protein accession	XP_568037
Protein GI	58261254
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAATT TATCGTTGTT GTTCCATCGT CCTGCAAAAC CCAGAATCGG CTCGTCTCCA 
AGTCATTCTT CTTCGCTCTA CATCTCCAGG ATGTCGGATA ACGCTCCCAC ACCTCAAAAA 
ATACGAGACA CAAATCCATA TGCCTCTCTC ATCTCTCAGC AAATCGCGAT CATCCCTTCG 
TTCACCCTAG AGTCAGGTGT CACTCTTAAT AATGTTCCAG TGGCATACAA GACCTGGGGT 
AAACTTAACG AAAAAGCCGA CAACTGTTTA GTCATCTGTC ATGCTTTGAC AGGTAGTGCT 
GATGTCGAAG ATTGGTACGT CACTCCGTTC GCCTTGCGGA GTAGTGAGGG CTAATCGTCT 
CCTTACAGGT GGGGACCGTT GCTTGGTCTC AACAAGGCCT TTGACCCGAC CAGATTTTTC 
ATCTTCTGTG GAAACGTTAT AGGTTCACCC TACGGCACTA TTTCCAGTGT CACTACCAAC 
CCCGAGACTG GCAAGCCTTT TGGTCCCGAG ATGCCCGGAA GTAGCGTCAA GGATGATGTT 
CGGTATGCCA TGTCTACATA CTAGTTTACT GGGTGCTGAC AAATGACAGA TTGCATTACA 
TAATTCTCAA ATCTCTTGGT GTGAAATCGG TGGCAGCCGT CGTTGGTGGA TCCATGGGTG 
GTATGACTGT TCTTGAATAC CCACTCAATA CCCCTCCTGG GTTTGTCAGA GCCATTATCC 
CCCTTGCGAC TTCAGCTCGT CATTCAGCTT GGTGTATTTC TTGGGGAGAA GCACAGCGTC 
AATCTATCTA CTCCGATCCA GACTACAAAG ACGGTTACTA TTACGAAATT GAGGAGGAAG 
GAGGCAAAGT TGACCTGGCT CGACAGCCAG CCAGGGGTCT GGCTGCGGCT AGAATGGCGG 
CTTTGTTGAC TTACAGGAGT AGAGACAGCT TTGAAAGCCG ATTCGGCCGA CGTGCCGGCG 
GCGGTAAATC GTCAGTGCCC AAGGGTGGTG TACGAATCAT GGGTGGTCAA GAGACGACCG 
ACCCTAGCGT CCCCAGTGAG AGCGATCTCG CTGCCAAGTC CCCCAGCTGG AGAGCCTGGA 
GGGAGCATAA CGACGGGCAC AGAAGCTCTG GCGCAAGACC GATATCTCGT AGCGGGAGCG 
AAGGCCCTAA CCGTGGAGAG GGTGATGCGG CTCAGGCTGA GGTTGTAAAG ACTCAAGAAG 
TGAAGGCCAA CGGGAATAAA ATTGGAACTG GCGGAGAAGC ACCGCCCAAA ATCTTTTCTG 
CGCAAAGCTA TCTTCGCTAC CAGGGAGACA AGGTGAGACT TCCTTAACTG GAATATGCGA 
GCATCGTTGA CGTTAGCGCA GTTTACTGGT CGATTTGATG CCAACTGTTA CATCCACATC 
ACCCGTAAAC TCGACACCCA CGATCTGTCC GCTCCTTCCC GTGACACTTC TCTGTCCTCA 
CTCTCTTCTG GTCTTCCCTC GTCCGCCGAC GCAACAGAAG AAGAGCTCAA TGCCCGTTTG 
ATCCACGCTC TTTCTCTTGA ACCTCCCGCT TTGGTCATCG GCATTGAGTC CGATGGCTTG 
TTCACCACTT CCGAACAACG CGAGCTTGCA GCTGGGATCC CCGATGCAGA GCTTGTTGTC 
ATTCCTTCCC CTGACGGACA TGACGGTTTC TTATTGGAGT TTGAAGCCAT TAACGGATGG 
GTTGAAGGAT GGCTGAAGAG AAAGATGCCC GAGTTCTACG AGAAACGAGT GATCGATCCC 
GAAGATTATG TACAGGGAGA AGAAGGATTT GACATCAAAA AGGAAAGCGT ATTCGGCGAG 
GCCGAGGCAG ATGTTACGAG GTGGTAATTT TTTTGGTCAG TGGCGCGTGG TTGGGATATT 
GTGATATAGA ACTGGCTTCA AATCAATTGT ATAAAGGGAC TGCAAGAGTA CAGTACCCAA 
CTACTGTACT ACTAAAAACA TACATATATC ATCTCTCCAA CAGAGGACAC ATCATGA

Protein sequence

MGNLSLLFHR PAKPRIGSSP SHSSSLYISR MSDNAPTPQK IRDTNPYASL ISQQIAIIPS 
FTLESGVTLN NVPVAYKTWG KLNEKADNCL VICHALTGSA DVEDWWGPLL GLNKAFDPTR 
FFIFCGNVIG SPYGTISSVT TNPETGKPFG PEMPGSSVKD DVRLHYIILK SLGVKSVAAV 
VGGSMGGMTV LEYPLNTPPG FVRAIIPLAT SARHSAWCIS WGEAQRQSIY SDPDYKDGYY 
YEIEEEGGKV DLARQPARGL AAARMAALLT YRSRDSFESR FGRRAGGGKS SVPKGGVRIM 
GGQETTDPSV PSESDLAAKS PSWRAWREHN DGHRSSGARP ISRSGSEGPN RGEGDAAQAE 
VVKTQEVKAN GNKIGTGGEA PPKIFSAQSY LRYQGDKFTG RFDANCYIHI TRKLDTHDLS 
APSRDTSLSS LSSGLPSSAD ATEEELNARL IHALSLEPPA LVIGIESDGL FTTSEQRELA 
AGIPDAELVV IPSPDGHDGF LLEFEAINGW VEGWLKRKMP EFYEKRVIDP EDYVQGEEGF 
DIKKESVFGE AEADVTRW