Gene ANIA_10020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ANIA_10020
Symbol
ID	0
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Aspergillus nidulans FGSC A4
Kingdom	Eukaryota
Replicon accession	BN001308
Strand	+
Start bp	4465498
End bp	4468583
Gene Length	3086 bp
Protein Length	906 aa
Translation table
GC content	50%
IMG OID
Product	26S proteasome regulatory subunit Mts4, putative (AFU_orthologue; AFUA_5G11720)
Protein accession	CBF90150
Protein GI	259489680
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.857696
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.62117
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGG AAGGCGAGCG GTCAGCTCCG GCCGACAAGG GCAAGGGCAA GGTTGATGAT 
GTCAAGGATC TTGGAGGGAG TAAAGAGAAG CCTGAGGAGA AGACACAAGG CAACGGGAAG 
AAGAAGGACG ATGAGCCGCA GGAAGGTAAG CAGCACCTCT TTTATCGTGA TGGAAGCATG 
ATTCGGTTCC CATCATCAGC TGTGACGTGT ATCTAATTAT GTTTTCTGCA GAGGAGCTCA 
GTGAAGAGGA TCAACAGCTA AAGAGTGAAC TCGAGATGCT TGTTGAAAGG TTACAGGTAT 
GATGGCAGAG ATTGCCTGCT GTTCACTTTG CCAACGCTGA CCGATCTGCC GCATCGCAGG 
AACCGGATAC TTCGCTTTAC GGACCCGCTT TGGACGCCAT CAAGACTTTT ATTAAAACTT 
CTACCTCTTC AATGACTGCA GTTCCTAAGC CTCTGAAATT CCTACGACCA CACTACGATG 
ATCTAGCGGC GCTCTATGAC AAGTGGTCCG CCGGCGCAAC CAAGGTGGGT TCAGGACGAA 
TAGTACACAA GACCGAAAAC TCATGTTTTG CCTTATTTTC AGGATTCGTT GGCGGATATG 
CTTTCTGTCC TCGGAATGAC GTACGGGGAC GAAGAGAAAC TCGAAACGCT CAAATACCGA 
CTTCTCACCA AATCGGATGA CCTCGGTTCC TGGGGCCACG AATACGTCAG GCACCTGGCG 
TTGGAGATCG GCCAGGAATA TCAGAACAGA GTAAACGACG AAAAGGAAGT AGACGATCTG 
ATCAAACTCG CGGTTTCGCT TGTTCCATAT TTCCTTAGAC ACAATGCAGA AGCCGATGCC 
GTTGATCTTA TGAGCGAACT TGAGATTATA GAGGAGATTC CTCAGTTCGT GGATGAGAAC 
ACATATTCAA GGGTTTGCTT GTATATGGTC AGCATGGTGC CTCTCCTTAC CTACCCCGAG 
GACCACCAGT TCCTCCGGAC GGCACACGAA ATCTACGTTC GTTACAAGGA GCTCACGAAA 
GCTATTGTGC TCGCTATCCG CCTAAACGAT GTTGACCTCA TCAAGAGTGA CCTTGAAGCG 
ACGTCGGATC GGTCGCTCAA GAAACAGATG GCTTTCCTAG TTTCTAGGCA ACAAATATGG 
CTCGATGACT TGGGCGATGA CGAGCAGGAC GAGACTTTCA TGGAGTGTCT GAACAACACC 
TCGATCCCAA AGCATTTCAA GTCGCTTGGG AAGGAACTGA ACATCCTCGA CCCAATTATG 
CCGGAAGACA TCTACAAAAC CCACTTAGAA AGCAGCCGAG GAGCAGGCCT CACCAATGTC 
GACTCTGCCA GACATAATCT TGCAAGTGCC TTTGTCAATG CATTCGCAAA TGCCGGTTTT 
GGCAACGATG AGATGATGAT TGTCGAAGGT GACAAGGGTT CTTGGGTTTG GAAGACAAAG 
GATGATGGCA TGTTGTCTAC CACCGCCTCA ATGGGTATGC TCCTGCACCG AGATGTCGAC 
ACTGGTTTGG ACAAAATTGA TAAGTACACG TACGCCTCCG AGGATCAGAT CAAGGCCGGT 
GCTTTATTGT CTATTGGAAT ACTCAATTCA GGCGTGCGCC TTGATTCTGA CCCCGCGTTG 
GCCCTTCTGT GTGACAACGA GAACTTGGAG GCAAAGAATA TTCCCATGAG AGTTGCCACA 
ATCATGGGCC TTGGTTTAGC GTACGCCGGG TCCAACAAGC AGGAAATTCT TGACGCTTTA 
CTGCCTATCG TGGAAGATGT ATCTCTCGAT ATGCAACTCT CCGCAATGGC GGCTGTCTCA 
CTTGGTCTTG TCTTTGTTGG GTCATCGAAT CACCAAGTCA GTGAGGCAAT CGCTACCACC 
CTCATGGACG AGGAGCGCCA GAAGCAGCTT AAGGATAAAT GGACTCGCTT CATGGCTCTT 
GGTCTAGCGC TTTTGTACTT CGGTCGCCAG GAAGAAGTTG ATGTGATCCT CGACATCCTC 
AAGGCTGTCG ATCATCCTAT GGCGAAGCCT ACCTCCGTCC TCGCCTCCGT CTGTGCTTGG 
GCAGGTACCG GCACCGTTCT GAAGCTGCAG GAGCTTCTCC ACATCTGCAA CGATGTCATT 
GAGGAAAGTG ATGAGAAGCA GGGTGAAGAG CTTGTGCAAT CTTACGCCGT GCTAGGTCTG 
TCGTTGATTG CGATGGGAGA AGATGTTGGT CAGGATATGA TTCTTCGACA GTTCGGCCAT 
CTCATGCACT ACGGCGCTAG CAACATTCGA AAGGCGGTTC CTCTTGCTAT GGGTCTTATC 
AGCCCAAGTA ACCCTCAGAT GAAGGTGTAC GACACTTTAT CGAGGTACAG TCACGACAAT 
GATAATGATG TTGCCATTAA TGCCATTTTC GCCATGGGTC TCTGTGGTGC CGGTACGAAG 
AACTCGCGTT TGGCGCAACT ATTGAGGCAG TTGGCCAGCT ACTACCACCG CGACCAGAAC 
TCCTTATTCA TGGTGCGTAT TGCTCAGGGT CTACTGCACA TGGGCAAGGG CACTATGACA 
CTAAACCCAT TCCACACCGA CCGCCAGGTG CTGAGCCGAG TATCGGCTGC TGGCTTGCTC 
ACTGTTCTCG TGTCGTTGAT CGATGCGAAG CAGTTCATCC TTGCTGAGCA CCATTACCTC 
CTCTACTTCC TCATCACAGC CATGTACCCG CGCTTCCTTG TCACGCTCGA CGAAGACCTC 
CAGCCGCTTC CGGTCAACGT CCGCGTCGGA CAGGCTGTTG ATGTTGTTGG ACAGGCTGGA 
AGGCCAAAGA CGATCACTGG TTGGCAGACA CAGAGCACCC CTGTGCTGCT TTCCTACGGT 
GAGCGAGCAG AGCTGGAGGA TGAGAAATAT ATTCCTCTCA GTAGCACATT GGAGGGTTTG 
GTTATCTTGC GTAAGGTAAG TCATCGCAGC TTCTCTGTAT TGTGTACGAA CATTTCTAAC 
ATTCTCACAG AACCCTAACT GGGAGGAAGA AAGCTCCGCC TGAGCAACAG TGTCCTGAAT 
GGTATCTAGT GAGATAGACC AAACGCAATA TCTGGCGTTC CTATACAGCT TAGGCCTTAA 
TGAATTCACA AAAGTCCAAA GCATAG

Protein sequence

MAKEGERSAP ADKGKGKVDD VKDLGGSKEK PEEKTQGNGK KKDDEPQEEE LSEEDQQLKS 
ELEMLVERLQ EPDTSLYGPA LDAIKTFIKT STSSMTAVPK PLKFLRPHYD DLAALYDKWS 
AGATKDSLAD MLSVLGMTYG DEEKLETLKY RLLTKSDDLG SWGHEYVRHL ALEIGQEYQN 
RVNDEKEVDD LIKLAVSLVP YFLRHNAEAD AVDLMSELEI IEEIPQFVDE NTYSRVCLYM 
VSMVPLLTYP EDHQFLRTAH EIYVRYKELT KAIVLAIRLN DVDLIKSDLE ATSDRSLKKQ 
MAFLVSRQQI WLDDLGDDEQ DETFMECLNN TSIPKHFKSL GKELNILDPI MPEDIYKTHL 
ESSRGAGLTN VDSARHNLAS AFVNAFANAG FGNDEMMIVE GDKGSWVWKT KDDGMLSTTA 
SMGMLLHRDV DTGLDKIDKY TYASEDQIKA GALLSIGILN SGVRLDSDPA LALLCDNENL 
EAKNIPMRVA TIMGLGLAYA GSNKQEILDA LLPIVEDVSL DMQLSAMAAV SLGLVFVGSS 
NHQVSEAIAT TLMDEERQKQ LKDKWTRFMA LGLALLYFGR QEEVDVILDI LKAVDHPMAK 
PTSVLASVCA WAGTGTVLKL QELLHICNDV IEESDEKQGE ELVQSYAVLG LSLIAMGEDV 
GQDMILRQFG HLMHYGASNI RKAVPLAMGL ISPSNPQMKV YDTLSRYSHD NDNDVAINAI 
FAMGLCGAGT KNSRLAQLLR QLASYYHRDQ NSLFMVRIAQ GLLHMGKGTM TLNPFHTDRQ 
VLSRVSAAGL LTVLVSLIDA KQFILAEHHY LLYFLITAMY PRFLVTLDED LQPLPVNVRV 
GQAVDVVGQA GRPKTITGWQ TQSTPVLLSY GERAELEDEK YIPLSSTLEG LVILRKNPNW 
EEESSA