Gene CNF03410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF03410
Symbol
ID	3258378
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	-
Start bp	1005255
End bp	1007182
Gene Length	1928 bp
Protein Length	534 aa
Translation table
GC content	49%
IMG OID	638257459
Product	anthranilate synthase, putative
Protein accession	XP_571668
Protein GI	58269024
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAAACTCGCA AAATGGACCC CTCAGTAAGC ATTTCAACAC CATTGCTGTT ACGTGGATGC 
TTACTCTTCG TCAGGTTTCG AAGCCTACGC CCTCTCTTGA GGAGCTTACA AACCTCTTCG 
CCACGGCCTC CTCGTCTACC ACCACTCTCA CTTCTCGATC CGCCACCTTA TTTCCCACTC 
CCAATGCCGA ACCCTCAAAA CCCGTCGAGC CCGCGAAGCC TAACCTCATT CCTATCTATG 
TTGAAATTCC TGCCGATTTG CTCACCCCCG TTTCGGCCTA TTTAAAGATT GCAAAGGATG 
AAAAGTACAG CTACTTATTG GAGAGTGTTG TTGGTGGAGA AAGCTTGGCC AGATATAGTT 
TTGTCGGTTC TAGTGAGTCC ATCAACGTAG TTTGCCAACC ATTCAGACTG ACATACTTGT 
AAGACCCTTT CAAAACCATC AAAACCGGCG CGGGAGAAGA AGTCGAGGGT GACCCCCTGG 
AAGCTTTGGA GAAGGAACTT GAGCCCTACA GATTCGCTAA GATCCCTGAA ATCTCTGCCT 
TCACTGGAGG TGCCGTTGGT TTTATTACCT ACGATGCTAT CAACCATTTT GAACCCGTCA 
CCACTCCCGC CACACCTCTT CACAACCCTA TCCCTGGCAT GCCTGAGGCT TGTTTCATGC 
TTTTCTCTAC CAATATCATC TTTGACCACA TCTACCAGAC AGTCAAGATA GTGTCTCATG 
TCTACCTCCG CGACGGTACA CCCGCTTCCC AAATCCCTTC TCTTTACGAT GAAGCCTCAG 
CCAGAATTGA GAGTGCCCGA CGTAAGCTCA TGAACCCCGA AACCCCCATG CCTCACCAAG 
GGCCTATCAC TCTTGGTAAC CAGTCCGAGA GCAATGTTGG AAAGGCCGGA TACGAAGGTT 
TCGTTACCAA GCTCAAGGAG CACATTGTTA AGGGCGATAT CATCCAGGCT GTGCCCTCGC 
AAAGACTGAC TAGAGAGACT GCTTTGCATC CGTTCAATGT GTACAGGCAC TTGAGAAGAT 
TGAACCCCAG TCCTTACATG TTCTACTTGG ACTGCGGAGA TGTTCGATTA GTGGGCGCAA 
GTCCAGAGAC GCTGTGTAAG GTCGAGGGAA GAAAAGTGTA CAACCACGCT ATTGCAGGTA 
CTGTTAAACG AGGGAAGACC GCGGAGGGTA TGTCCATTTC TTCAAGCGGT TGGATGTATA 
GGCTGACATT GTATTGTAGA GGACGCCGTC CTTGGTGCCG GACTTCTTGC CTCTGACAAG 
GACCGAGCGG AGCACATCAT GCTTGTCGAC CTTGCCAGAA ACGATGTCAA TAGAATTTGC 
AAGCCCGAGA CCGTTAATGT TGACAACCTT ATGCAAGTCG AAAAGTTCAG TCACGTTATA 
CACTTGACAA GTCAGATCAG CGGTATGCTG AGGGATGACC AATCTAGGTA AGCTCTCAAT 
CTGCTTGGAC GAATTTGCAA GAAGACCGAC ATTACGCAGG TTCGACGCCT TCCGATCCAT 
CTTCCCTGCC GGTACCGTCT CTGGCGCTCC CAAGATCAAG GCAGTCCAAC TCATTTCTGG 
TCTTGAGAAG GAGCGACGTG GTGTCTACGC CGGTGCGGTT GGTCGATTCG ACTTTGACAG 
GGACAATCTC GATACCTGTA TCGCCATCCG AACAATGACA TTTAAGGATG GAAAGGTGTT 
CTTGCAGGCA GGTGGAGGTA TCGTCTTTGA CAGTGTGGAA GAAGATGAGT TTGTGGAGAC 
CATTAACAAG TTGGGGGCGA ATGTCAAATG TATCGAAGAG GCTGAGAGTG AGTCGATTTT 
TATCTTTTTG CTTTGTTCCG GATTTATCGT GGTGCTGATC AGACGTTGCA GAGTACTACG 
CGAGGTTGCA AGGACAGAAC GTGTAAAAAT TTTTAGACAA TATAGAAGCC CATGAACCTG 
TGCATTAC

Protein sequence

MDPSVSKPTP SLEELTNLFA TASSSTTTLT SRSATLFPTP NAEPSKPVEP AKPNLIPIYV 
EIPADLLTPV SAYLKIAKDE KYSYLLESVV GGESLARYSF VGSNPFKTIK TGAGEEVEGD 
PLEALEKELE PYRFAKIPEI SAFTGGAVGF ITYDAINHFE PVTTPATPLH NPIPGMPEAC 
FMLFSTNIIF DHIYQTVKIV SHVYLRDGTP ASQIPSLYDE ASARIESARR KLMNPETPMP 
HQGPITLGNQ SESNVGKAGY EGFVTKLKEH IVKGDIIQAV PSQRLTRETA LHPFNVYRHL 
RRLNPSPYMF YLDCGDVRLV GASPETLCKV EGRKVYNHAI AGTVKRGKTA EEDAVLGAGL 
LASDKDRAEH IMLVDLARND VNRICKPETV NVDNLMQVEK FSHVIHLTSQ ISGMLRDDQS 
RFDAFRSIFP AGTVSGAPKI KAVQLISGLE KERRGVYAGA VGRFDFDRDN LDTCIAIRTM 
TFKDGKVFLQ AGGGIVFDSV EEDEFVETIN KLGANVKCIE EAEKYYARLQ GQNV