Gene ANIA_04372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ANIA_04372
Symbol
ID	0
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Aspergillus nidulans FGSC A4
Kingdom	Eukaryota
Replicon accession	BN001303
Strand	+
Start bp	2231480
End bp	2232635
Gene Length	1156 bp
Protein Length	361 aa
Translation table
GC content	56%
IMG OID
Product	Endo-polygalacturonase [Source:UniProtKB/TrEMBL;Acc:Q1HFT2]
Protein accession	CBF77661
Protein GI	259482818
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.217421
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTTCC TTCAAAACTC CCTTATTGCT GCGGCAATGG GCGCTGCGCT GGTCGCTGCC 
GCCCCTGCTG CTGATCTTGA TGCTCGAAGC TCGTGCACCT TCACCTCTGC CTCTGCGGCC 
AAGTCTGGCG CATCCAAGTG CTCCACTGTC ACCCTCAAGA GCATCCAAGT TCCTGCCGGT 
GAGACCCTTG ACCTGACCGG TCTCAAATCG GGTGCTACTG TACGTAGTTC CCCTTCCCCC 
TCGCCGCCTC ATTGATCTCG GCTTTCTAAC GGAGGAGCAG GTTATCTTTG AAGGCGAGAC 
AACCTTTGGC TACAAAGAAT GGAAAGGACC GCTGATCTCC ATGTCCGGTG ACAAAATCAC 
GGTTAAGCAA GCCTCTGGCG CAAAGATCAA CTGCGACGGG GCCCGCTGGT GGGACACCAA 
GGGCAGCAAC GGCGGCAAGA CCAAGCCCAA GTTCTTCAGC GCGCATAAGC TGAACAACTC 
CAAGATTCAG GGGCTGAAGA TCTACAACAC CCCTGTCCAG GGATTCAGTA TCCAGTCCGA 
CCACCTGACC ATTTCGGACG TGACCATCGA CAACTCCGCC GGCACCAGCA AGGGCCACAA 
CACCGATGCC TTTGACATCG GCTCCTCGAC GTACATTACC ATCGACGGTG CGACTGTCTA 
CAACCAGGAT GACTGTATTG CCATTAACTC CGGCGAGCAC ATCACCTTCA CCAACGGATA 
CTGTTCCGGC GGCCATGGCT TGTCTATTGG CTCCGTCGGC GGCCGCAGCG ACAACACCGT 
CAAGAGCGTC ACCATCTCCA ACAGCAAGGT CGTCGACTCC CAAAACGGCG TCCGCATCAA 
GACCGTCTAC AAGGCTACCG GCTCCGTCAC CGATGTCACC TTCCAGGACA TCGAACTCTC 
TGGAATCACC AAGTACGGCC TCATTGTTGA GCAGGACTAT GAGAATGGTA GCCCAACAGG 
TACCCCTACC AACGGTGTCG AGGTTGAAGA TATCACCTTC AAGAAGATTA CCGGCTCTGT 
GGATAGCAGT GCCACACGTG TCAATATCCT CTGCGGGTCA GGGAGCTGCA AAGACTGGAC 
TTGGTCTGGG GTTGATATTA CCGGCGGAAA GAAGAGCTCT AAGTGCAAGA ATGTTCCGTC 
TGGTGCTTCG TGCTAG

Protein sequence

MHFLQNSLIA AAMGAALVAA APAADLDARS SCTFTSASAA KSGASKCSTV TLKSIQVPAG 
ETLDLTGLKS GATVRETTFG YKEWKGPLIS MSGDKITVKQ ASGAKINCDG ARWWDTKGSN 
GGKTKPKFFS AHKLNNSKIQ GLKIYNTPVQ GFSIQSDHLT ISDVTIDNSA GTSKGHNTDA 
FDIGSSTYIT IDGATVYNQD DCIAINSGEH ITFTNGYCSG GHGLSIGSVG GRSDNTVKSV 
TISNSKVVDS QNGVRIKTVY KATGSVTDVT FQDIELSGIT KYGLIVEQDY ENGSPTGTPT 
NGVEVEDITF KKITGSVDSS ATRVNILCGS GSCKDWTWSG VDITGGKKSS KCKNVPSGAS 
C