Gene CNA03810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNA03810
Symbol
ID	3253422
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006670
Strand	-
Start bp	1025170
End bp	1028240
Gene Length	3071 bp
Protein Length	682 aa
Translation table
GC content	45%
IMG OID	638252700
Product	1,4-alpha-glucan branching enzyme, putative
Protein accession	XP_566719
Protein GI	58258613
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0296] 1,4-alpha-glucan branching enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTTCTCATCT CTCAAGTCTT CAGTTAATCT TACATTCCAT AGATTTATTC ACTTCAATCA 
CCATGACAGC TGTTTCGTTA TCAGATGGTG AGCACTCTCC GACGCGAGCG CAGTACCCTC 
ATTTGCTCAC TTGAGACTCG TTCTCCTCTG AAAGGCACAG CCGTGTTGAA GACTGATCCT 
TGGTAAGTCC CGCCTTTTCC TTTCGCAGAG CTTTGCCAAG TTGTCTAATT GCATACCTAG 
GTTGGAACCG TTTTCTGGCG CCCTCCGTGA ACGATATGCC GCTTATCAAA AGCAACGTAC 
CATTATTGAA GAGCACGAAG GCGGTCTCGC CGAATTCTCA AAAGGCTATA AATCTATGGG 
CTTCCAGATT GATAAAAATG GGGGTGTAAG GTATCGGGAA TGGGCCTCTA ACGCGACAGA 
AGCGAGACTC ATTGGCGAAT TCAGTGAGTC TAGCTGGTCT AGCTCCGTAT GGTGTCTGAA 
ACCAGGTATC GACAATATAA TTTACTCTAT ATCGCAGACA ACTGGTCCCA TACGGCCAAT 
CCTATGACAA AGTCTCCTTT CGGTGTATGG GAATGTTACG TACCTCCAGT TTCACCCGGC 
GTCTGCGCCA TTCCCCATGA TTCCATGGTC AAGATATCAA TGACACTCCC AGGAGGTGAA 
TCTATTGACA GGATTCCTAC CTGGATTACT CGAGTCACCC AAGATCTTAA CATATCTCCT 
ATATATGACG GACGCTTCTG GAACCCGCCA AAGGAGCAAC AGTACCAATT CAAACATGGG 
CATTCTACTC GGCCGGTAGA GGGATTGAAA ATTTACGAGG CCCACGGTAT GGCCTACCTT 
GCTAGACTCA TTGTAATATT GGCTAACTGG TCATCTAGTG GGGATTTCTA GCCCCAATAT 
GAGAGTTACC ACATACAAGG AGTTCGAGGT GGATGTCCTA CCGAAGATAA AACAGCTTGG 
CTATAATTGT ATTCAGATGT GAGTTACAGC GTTGATTTTG TTCTTGAATC CAAATAATGA 
CTTGGCGCAG GATGGCTATT ATGGAGCACG CATACTACGC CTGTAAGTTC TTTTGTGCCC 
GGTATGCTGT AGTTTGGACT GACATGCTTT CCTACAGCAT TCGGCTATCA AGTCACCAAT 
TTCTTTGCTG CTTCGTCTCG CTTCGGTATG TCTTTGCCCA CCTCTGCTTC TGATTGAAAG 
TGCGCTGATC GTGTTTGCAC AGGTACACCG GAAGAACTGA AATCTCTCGT TGACAAGGCA 
CACGAATTGG GTCTTACCGT ACTTCTTGAT GTGGTTCATT CCCATGCTAG TAAAAACATT 
CTTGATGGGT AAATCATGCT TTCGAGTGCT GTGCTTACCT ATGGCTGACC TTTTCGGCAT 
AGTATCAATA TGTATGATGG TTCTGACCAC CTTTACTTCC ATGAAGGTGG CAGAGGCAGA 
CATGATCAAT GGGATTCTCG CCTCTTCAAT TATGGCCAAC ATGAAGTGCT CCGCTTTTTG 
CTTTCTAATC TCCGATTCTG GATGGACATA TACATGTTTG ATGGCTTCAG GTTCGATGGT 
GTCACCAGTA TGATGTACAA ACATCATGGT ATTGGTTCAG GTTTCTCAGG TGAATTCTTT 
CCATTTCTTC ACCTGGTTTT GCTGATTCAC TATGCTAACA ACTTTTGATC CAGGAGGATA 
TCATGAATAC TTTGGGGATT CAGTAGACCT TGAGGCCATG GTATACCTCA TGCTGGTGTG 
TTTTCATTAC AAATTTGCAA ATCATACGCC GTCCGCTGAC TTTTCTAGGC AAATGCCATG 
CTGCACGAGA CTTATCCTCA TGTTGTCACC ATAGCGGAGG ACGTCTCCGG GATGCCCACC 
CTTTGCCGTC CAGTTGCAGA GGGTGGTGTT GGATTTGATT ATCGACTTTC CATGGCCATC 
CCTGACATGT GGATCAAGCT TCTCAAAGAA TACACCGATG ATCAATGGGA GATGGGCCAG 
ATTGTCCACA ACCTCACTAA TCGAAGGCAC TTGGAGAAAA GTGTTGCATA CGCTGAAAGT 
CATGATCAGG CTTTGGTTGG AGACAAGACT TTAGCCTTCT GGTTGATGGA TAAGGAGATG 
TGTAGGTTAT ATCCCGCCCA ATTGATATTT ATATCCAGGA TAATGCTTAC ATCGACTCAT 
TAGATGACTT TATGTCTGAT CTTTCCCCTT TGACTCCCAT TATCGACAGG GGCTTAGCTC 
TTCATAAAAT GATAAGGTAA ACCACACTTC TTCGGTTTCC TTGTAACAGG AGCTGACGGC 
CTGTCCACGA AGATTCATTG TCCATACACT TGGAGGAGAG GCGTATCTCA ATTTTGAAGG 
GAATGAGTTT GGACACCCTG AGTGAGTGCA GACCTGTTTT TCACATGTTC ACCATTTTTG 
ACGCTTTTGG AACAGATGGA TGGATTTCCC ACGAGAAGGC AATGGCAACT CCTTTGCCCA 
TGCTCGTCGC CAGTTCAACC TTGTGGATGA CAAGTTGTTG CGTTACAAAT ATCTGTATGA 
GTTTGATGTC GCTATGAACT GGCTGGAGGA CAAATACAAG TGGCTCAACT CCCCTCAAGT 
ACGTTCTTTT CATTCTGAGC TCTGTCCGAT GTCTGAGCTA ACTATCTGCT TCCTGAAAAG 
GCTTATGTTT CTCTCAAACA TGAAGGAGAC AAGATGATTG TGTTTGAGAG AGCCGGACTG 
CTATTCATTT TCAATTGTAA GCATTTCACG CTTTCGCCTT GGCCATGTGC TAACACGTCA 
TAGTCCATCC CACACAATCA TTCACGGACT ATCGAGTTGG TGTAGATACT GCAGGAGAGT 
ACAAGGTCAT CTTAACAAGT GATGAGACTA GATTCGGCGG ACACAATCGC ATTGATATGG 
GTGGGAGGTA TTTCACGACA CCCATGGAAT GGAATGGGCG GAAGAATTGG CTTCAAGTCT 
ATTCGCCTTC GAGGACTGTA CTCGTTCTTG GGCTTTAATT GGATACTAGC CAGAAAAAAA 
TGTTACCACG AAGACGCATA ATCATCTGTA TGTTACCGAA GTTTGAAAGC AATGAAATAA 
TTCTGTCTCT G

Protein sequence

MTAVSLSDGT AVLKTDPWLE PFSGALRERY AAYQKQRTII EEHEGGLAEF SKGYKSMGFQ 
IDKNGGVRYR EWASNATEAR LIGEFNNWSH TANPMTKSPF GVWECYVPPV SPGVCAIPHD 
SMVKISMTLP GGESIDRIPT WITRVTQDLN ISPIYDGRFW NPPKEQQYQF KHGHSTRPVE 
GLKIYEAHVG ISSPNMRVTT YKEFEVDVLP KIKQLGYNCI QMMAIMEHAY YASFGYQVTN 
FFAASSRFGT PEELKSLVDK AHELGLTVLL DVVHSHASKN ILDGINMYDG SDHLYFHEGG 
RGRHDQWDSR LFNYGQHEVL RFLLSNLRFW MDIYMFDGFR FDGVTSMMYK HHGIGSGFSG 
GYHEYFGDSV DLEAMVYLML ANAMLHETYP HVVTIAEDVS GMPTLCRPVA EGGVGFDYRL 
SMAIPDMWIK LLKEYTDDQW EMGQIVHNLT NRRHLEKSVA YAESHDQALV GDKTLAFWLM 
DKEMYDFMSD LSPLTPIIDR GLALHKMIRF IVHTLGGEAY LNFEGNEFGH PEWMDFPREG 
NGNSFAHARR QFNLVDDKLL RYKYLYEFDV AMNWLEDKYK WLNSPQAYVS LKHEGDKMIV 
FERAGLLFIF NFHPTQSFTD YRVGVDTAGE YKVILTSDET RFGGHNRIDM GGRYFTTPME 
WNGRKNWLQV YSPSRTVLVL GL