Gene ANIA_04236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ANIA_04236
Symbol
ID	0
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Aspergillus nidulans FGSC A4
Kingdom	Eukaryota
Replicon accession	BN001302
Strand	-
Start bp	1604544
End bp	1606312
Gene Length	1769 bp
Protein Length	465 aa
Translation table
GC content	51%
IMG OID
Product	hypothetical protein similar to TAT-binding protein 1 (Broad)
Protein accession	CBF74421
Protein GI	259481153
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.110869
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GATTTACCAG CAACCCAATA CCCCTTTTTC TTCTTGTCTC TACCTCTCTC TAACTATCTG 
TGCTCCTATA TTCTCTAATT TATCGTAGTT CTCCGCAGAC TGTTATCATG TCGACATTGG 
AGGATCTCGA CGATCTTGAG CGCGAGGAGA GAGACAAGAA GAAGGAGCAA GGCGATGGCG 
GCGATGGCAA GCAACCTGGT GGTGATGGAG ATGCCGAAAT GAAGGATCCG GATGCGAAGA 
AGAAAGATGA GGATGACGAT CTTCTAGACG AGGAAATCCT GAATTCAAGC ACAGCGGACA 
TTATCAAGCG GCGGCGAATG CTGGAGAACG AGCTTCGCAT AATGAAGAGC GAATACCAGC 
GGCTGACGCA CGAACAAAAT ACGATGAAGG AGAAGGTCAA GGACAATCAA GAGAAGATTG 
AGAACAATAG GTGAGACTTC TAGCTCTTCT AGATGGCGTG GCGATTTGGA ACTCCACCGG 
AAACCAGGAA CTGGGCGCAG AGTTTCCTGC GAATAGGGGC TAGTAGTCCT CGTTCATTTC 
TAACATTCAT ATCATAGGCA ACTACCGTAT CTCGTCGGAA ATGTTGTTGA GCTGCTAGAT 
TTGGACGTCG AAGCTGAAGC TGCCGAGGAG GGCGCCAACA TCGATCTAGA CGCCACCCGA 
GTAGGCAAAT CCGCTGTCAT CAAAACGTCG ACTCGTCAGA CCATCTACCT TCCTCTTATC 
GGCTTAGTTG ATCATGAGAA GCTTAAGCCT GGTGACCTTA TTGGTGTCAA CAAGGATTCA 
TACCTCATTC TCGATACCCT GCCGGCAGAA TACGACAACC GGGTGAAAGC AATGGAGGTC 
GACGAGAAGC CTACAGAGAA GTACACAGAT ATTGGTGGTC TGGATAAGCA GATTGAGGAG 
ATCGTCGAGG CTATTGTATG GCCCATGAAG GAAGCAGAGA GATTCAAGAA GCTTGGCATC 
AAGGCGCCGA AAGGTACTTA TCAAACAGTA TCTGGTGTAA ACAGACTCAC AACTAATACT 
GCTCATAGGT GCTCTGATGT ACGGGCCTCC CGGCACAGGA AAGACTCTTC TCGCCCGAGC 
CTGTGCAGCA GAAACTAACG CAACCTTCCT AAAACTCGCC GGCCCCCAGC TCGTGCAAAT 
GTTCATCGGT GACGGCGCGA AGCTCGTCCG GGACTGCTTC GCCCTTGCTA AAGAGAAGGC 
TCCCTCGATC ATTTTCATTG ATGAGCTTGA CGCTGTGGGC ACTAAGCGTT TCGACTCTGA 
GAAATCTGGT GATCGTGAAG TCCAACGAAC CATGCTTGAA CTCCTTAACC AGCTCGACGG 
ATTTGCCTCG GACGACCGCA TCAAGGTTCT CGCCGCCACC AACCGCGTCG ATGTCCTCGA 
CCCCGCCCTC CTCCGTTCCG GCCGTCTAGA CCGCAAGATC GAATTCCCTC TCCCCAATGA 
GGAAGCCCGC GCCAACATCC TCCAGATTCA CTCGCGCAAG ATGACTGTTG AGGACTCCGT 
TAACTGGGCT GAGTTGGCAC GCAGCACGGA TGAGTTTGGT GGCGCGCAGT TGAAGGCTGT 
CTGTGTGGAG GCTGGTATGA TTGCGCTGCG AAAGGGGCAC AGCAAGATCG GGCATGAGAA 
CTATGTGGAT GCCATTGCTG AAGTCCAGGC AAAGAAGAAG GATACGAACA TGGGTATCTA 
TGTTTGAACA AATTCTTGTA TCCTTTTGTA AGCCTAGATT TGGTTTAACT CTCCTTCCGC 
ATACAATGCG ATGTGTATCA ACTTACGTG

Protein sequence

MSTLEDLDDL EREERDKKKE QGDGGDGKQP GGDGDAEMKD PDAKKKDEDD DLLDEEILNS 
STADIIKRRR MLENELRIMK SEYQRLTHEQ NTMKEKVKDN QEKIENNRQL PYLVGNVVEL 
LDLDVEAEAA EEGANIDLDA TRVGKSAVIK TSTRQTIYLP LIGLVDHEKL KPGDLIGVNK 
DSYLILDTLP AEYDNRVKAM EVDEKPTEKY TDIGGLDKQI EEIVEAIVWP MKEAERFKKL 
GIKAPKGALM YGPPGTGKTL LARACAAETN ATFLKLAGPQ LVQMFIGDGA KLVRDCFALA 
KEKAPSIIFI DELDAVGTKR FDSEKSGDRE VQRTMLELLN QLDGFASDDR IKVLAATNRV 
DVLDPALLRS GRLDRKIEFP LPNEEARANI LQIHSRKMTV EDSVNWAELA RSTDEFGGAQ 
LKAVCVEAGM IALRKGHSKI GHENYVDAIA EVQAKKKDTN MGIYV