Gene ANIA_02534 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ANIA_02534
Symbol
ID	0
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Aspergillus nidulans FGSC A4
Kingdom	Eukaryota
Replicon accession	BN001307
Strand	+
Start bp	4199836
End bp	4201366
Gene Length	1531 bp
Protein Length	380 aa
Translation table
GC content	53%
IMG OID
Product	endoarabinanase (Eurofung)
Protein accession	CBF87045
Protein GI	259487963
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCTGC CCACTCTTGC AGCTTCGGCG TCTCTCCTCG TAGGCGTGGC GCATGGCTAT 
GCGTCGCCCG GGGCGTGCTC GGGTGCGTGC AACATTCACG ACCCGGCTTT GATCCGCCGT 
GAGTCTGATG GCAAGTATTT CCGCTTCTCA ACCGGTAACA AGATCTCTTA TGCGTCTGCT 
TCCTCCATTG AGGGCCCATG GACAGCGATT GGGTCCGTCT TGCCGGGCGG TTCGTCGATC 
GATCTGGATG GAAATGACGA TCTCTGGGTA AGTACCGGAG GATCGGCAGT TCGGCCTATT 
TGGGCGAAAT AAGTGCTAAT GCATACTCTC GCAGGCTCCC GATGTCCAGC TCGTCAATGG 
CGTATACTAT GTTCTCTATT CAGTTTCGAC CTTTGGGTCC CAGAATTCCG CGATTGGGCT 
CGCGACTTCT GACACGATGG ACCTCAACAC CTGGACGGAC CACGGCTCGA CGGGCATCCG 
GTCTGACTCC TCCAAGCCAT ACAATGCCAT TGATGGCAAC CTTTTCCAGG ATGATAGCGG 
GACCTGGTAC ATGAACTTTG GGTCGTTCTG GAATGACATC TACCAAGCAC AGATGAAATC 
TCCTCCCACA GCCGTCGCAT CGTCCTCGTA CCAGATCGCA TACCAGCCGG CTGGCGAGCA 
CGCGGTTGAG GGCGCGTACT TGTACAAGTA CGGCAACTAC TACTACCTCT TCTTCTCCGA 
GGGCAAATGC TGCGGCTATG ACTCTTCTAG GCCGGCTACT GGGGAAGAAT ACAAGATCAA 
AGTGTGCCGT TCGACCACGG CCACTGGTAA CTTTGTAAGC TCTCCGCCTC GATAATGGAT 
CGTGTTTTGG ACCCGCCTAA TTAGCCCAGG TTGATGCAAA TGGTGTTTCC TGCACTTCCG 
GCGGTGGAAC AATCGTCTTG GAAAGCCACG ACAATGTCTA CGGACCTGGA GGACAGTATG 
CCTCCCCAAT CCCACGAACT TTGGCAGAAA TGACTAATGT AAAACAGGGG TGTCTTCACC 
GACCCGACGC TCGGCCCTGT GCTGTACTAC CACTATGTTG ATACCACTAT TGGCTACGCT 
GATAGCCAGA AGCTCTTTGG ATGGAACGTT CTTGACTTCT CCAGCGGGTG GCCTGTTGTG 
TAAGACTCGA TCGAGTATGC TCGAATCGCG GCGAAACTGT GTGTATTTAG TGGCTATGAA 
GGTAACTGCA GGTGTCCTAT GATCCTGACT CAGCGTCCGC CAAGTAGACG ATCGTTCTCT 
ATGTACGTGG TTGTAAGTGC TGCTCTGGCG TGTGTGATGA GACCACTGTA GACGGACACG 
GTATAATGGG CACTGGGAGT CGTATAAAGT TTGTGTCTGC AAACCCTAAT ATAGCCCCTG 
GTTACAGCGC GGCCAGAAGA AAAGAGAAAA TAGGTTTGCT CGCTGCTCTG TAGGTGATTA 
TGGTAAGCGT GACCATTAGG GCAGGGGCAA CGGTGATGTC ACCGTTCTAA TGCTCTTTGC 
CCCGGCCACT CCGGCTTTAT TTGTTGACTA G

Protein sequence

MYLPTLAASA SLLVGVAHGY ASPGACSGAC NIHDPALIRR ESDGKYFRFS TGNKISYASA 
SSIEGPWTAI GSVLPGGSSI DLDGNDDLWA PDVQLVNGVY YVLYSVSTFG SQNSAIGLAT 
SDTMDLNTWT DHGSTGIRSD SSKPYNAIDG NLFQDDSGTW YMNFGSFWND IYQAQMKSPP 
TAVASSSYQI AYQPAGEHAV EGAYLYKYGN YYYLFFSEGK CCGYDSSRPA TGEEYKIKVC 
RSTTATGNFV DANGVSCTSG GGTIVLESHD NVYGPGGQGV FTDPTLGPVL YYHYVDTTIG 
YADSQKLFGW NVLDFSSGWP VVCPMILTQR PPSRRSFSIP WLQRGQKKRE NRFARCSGRG 
NGDVTVLMLF APATPALFVD