Gene ANIA_05101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ANIA_05101
Symbol
ID	0
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Aspergillus nidulans FGSC A4
Kingdom	Eukaryota
Replicon accession	BN001305
Strand	+
Start bp	955253
End bp	956453
Gene Length	1201 bp
Protein Length	311 aa
Translation table
GC content	49%
IMG OID
Product	metalloprotease MEP1 (AFU_orthologue; AFUA_1G07730)
Protein accession	CBF80862
Protein GI	259484546
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.00000175375
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTTCAAC TTCGTCGACT CCAGGACCTG GTTCTTATGC TGGCCTTCCT TCAGCAAACC 
TGTCTTGCTG TTCCTCGTTG GGGCAGGGGA TATTGTGCTA CTGCAGGCCC AGATGAATCG 
TTGAAGGCGG AATTTAGAAA ATTGAGCGCT CTCGAAAATG ATGGCATAGT CGAGCAAGGA 
AGTCGTAAGG CGCTGGAGCC CATTGAGATA GAGGTATGGT TCCATGTCGT GAGCAGCAAA 
GCGAGTGGCG ACGTGGTTTC GGACGGTATG ATTGCTACTC AGGTTAGTTC TGGATCTTTA 
TTCGTGTGCC AGCCCACCTA TTTTTCCATC ACATAATGTT GATTAATGGA CTAACTATAA 
TAAGTTATCT TACCTCCAAG ATGCATATCA AAACGCTTCA ATAAGCTACC GTCTCGAAGG 
GGTAACGCGC CATATCAACG ATAAATGGGC GCGTAATGAA GACGAGCTTA GCATGAAAGA 
TGCCCTCCGT AGAGGCAGCT ACCGAACCCT CAATGTCTAC TTCCAGTCCG ATCTCCAAGT 
TCTCTCAGGC TCCGAATCTC AGGGTCGTCT GCTCGGTACT TCGGAACAGT TATCAGCAAG 
CGTTCTCGGC TTCTGCACTT TACCCGACCC GAGTATTAAC AGTACTAGTC TGCGTTCCAG 
CTATGTGAAG GACGGATGCA ACGTGCTTGC AAAAACTATG CCAGGGGGGT CTCTAACGCA 
TTATAACCGA GGCGGAACCG CCATACACGA AATTGGTCAC TGGAACGGAC TCCTGCACAC 
TTTCGAGGGG GAGTCTTGCT CCCTTGACAA CGAGGGTGAT TATATAGAAG ACACACCCCA 
GGAGTCTATT CCGACCGATG GATGTCCTGC TCGCAAAGAC TCATGCCCAG GAAGCCCGGG 
TGTGGACCCT GTACACAACT TTATGGATTA TTCTTCTGAT GAGTGTTACG AGCACTTCAC 
GCCGGCCCAG GTTAAGAGGA TGCGTGACAT GTGGTTCACG ATGAGGGAAG GGAAATGATA 
AAAATAGCCT CACTGGTTCA CCATGGTACC ACCGACATGT AACAAGTAAT GACGGGGACA 
GGGAATTGGT GCAAATTGAT ACATAGCGGA CCCCATGGAC AGCGCTTTGA TGCCCTATGT 
GGCCGTACTG CATGATTCAT TCATATCTGT TTGACGGTCA ATGAGAAAGC CCTTTTCCTG 
G

Protein sequence

MLQLRRLQDL VLMLAFLQQT CLAVPRWGRG YCATAGPDES LKAEFRKLSA LENDGIVEQG 
SRKALEPIEI EVWFHVVSSK ASGDVVSDGM IATQLSYLQD AYQNASISYR LEGVTRHIND 
KWARNEDELS MKDALRRGSY RTLNVYFQSD LQVLSGSESQ GRLLGTSEQL SASVLGFCTL 
PDPSINSTSL RSSYVKDGCN VLAKTMPGGS LTHYNRGGTA IHEIGHWNGL LHTFEGESCS 
LDNEGDYIED TPQESIPTDG CPARKDSCPG SPGVDPVHNF MDYSSDECYE HFTPAQVKRM 
RDMWFTMREG K