Gene Aazo_1578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1578
Symbol
ID	9339370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1651732
End bp	1653891
Gene Length	2160 bp
Protein Length	719 aa
Translation table	11
GC content	42%
IMG OID
Product	peptidase C14 caspase catalytic subunit p20
Protein accession	YP_003720883
Protein GI	298490706
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAATTA TGAAACGGCG TGCGTTTTTA GAACGAATTG GCTCCATACT GGCAGTATTG 
GGACTGACTG AAGCTGAGTG GTTAACTTTA GGGAATCGCT ATTATCAAGC TTTAGCACAA 
CCCAAACCGC GTAAGTTGGC ATTGTTAATA GGTATCAATC AATATCCACA GAGTCCTGTC 
CTTAGTGGTT GTTTAACTGA TGTGGAATTG CAAAAAGAAC TTTTGATTCA CCGCTTTGGC 
TTTGCATCTG CGGATATTCT CACCTTAACT GAGGAACAAG CCAGCCGGGA ATTTATCGAA 
GCGGCTTGTT TAGATCACTT GGGTAACCAA GCGAAAGCTG ATGATACAGT CGTTTTTCAT 
TTTAGCGGCT ATGGCACTCG TGTTAAATTG GCAACTTTTC CAGAGACTGT GGAAAATGCC 
TTAATTCCTT TCGATGTAGA TACACAGAAT CAACTATCTG TCAACTATTT ATTAGAACAA 
ACTCTTTTAT TGTTGTTGCG CTCACTCCCT ACCAACCGAG TCACAACAAT ATTAGATACT 
AGTTATTATG CTCCCAGTAC ATTACAGACC CCTGCTTTGA AATTTCGTTC CCGCCCAGAA 
TCATCAGTAG CAAAGTTAGC ACTGGAGGAA TTGGCATTTC TCAAACAGCA ACAAACCCAG 
AATCCCGCAC TTAACAATGC AATGCTGCTA AAAGCAACCT CGACAGAAAA TCAGCAAGCG 
GGAGAATTGC TTTTTGGTAA TTTCAGTGCA GGTTTATTTA CCTACGTTTT GACCCAATAC 
TTATGGGAAA CTACCCCAGC CACAACCATT CAAATTCTGC TCTCTCATAT CCGTAGTTCC 
ATATACAAAT TGGGTAGCAA ACAGCAGCCA GGGTTATGGA CTGAAAAGAA AAATCCTCAA 
AGTGGTTTAA TTATTGATAA TTTCCCCCTG GTAAGTAGTG ATGCAGAAGG AGTGGTAATA 
GCTCTAAATG AAGATGGTAA AGCAGTCGAG TTATGGCTGG GAGGATTACC TCTGCAAGTT 
TTGGAATACT ATGGAGTTAA TTCCAGATTG ATTACACCGA CTGGAGAACA GTTAATCTTT 
AAGTCGCACA ATGGTTTAAC TGCAAAAGCA CAGATATCCA ACCAAGACGC TACCACATCG 
CTACAAGTTG GGCAAGTAGT ACAAGAAGCA GTGCGCGTCT TACCTCGGAA TATTAGTTTA 
ACTGTTCTCT TAGATTCTGG TCTAGAAAGA ATTGAGCGTG TAGATGCTAC CAGCGCCTTT 
GCGACAATTA CTCGGATAGT TAACATTACA GCAACAGAAC AGAAGCCTGA TTACATATTT 
GGCAAGTTAA AAAACATACC GAGTCGTTAT GGTCTTTTTT CCCTTGATGG TGAAGTGATT 
CTCAATACGG CCGGGGAAAC TGGAGAAGCC GTGAAAGTAG CAGTGCAGAG ATTAACACCA 
AAATTTTCTA CCCTGTTAGC AGCAAAGTTA TGGCGACTGA CAGAAAATCA AGTTTCTTCT 
CGCTTGGCTG TGAAAGCTAC TTTAGAGATG GTGAACAACA TCTCACCCGG TGTCGTTATG 
CAACAGCAAA CATGGCGCGG GTTTAGTGGG AAAAGTACAA CTCATAAAGC ACTCACCACC 
CCAGGAACAG CTATTCCCAC AGTTCCCGTC GGGAGTACGA TGCAGTATAG GGTAGAAAAT 
TTGAGCGCTC GCCCGATATA TTTAATGTTA GTGGGGTTAA ATAATAGTAG AAGTGCCATC 
ACCTTTTACC CTTGGGAAGT CTCTAAACTA GCAGATACCT CTGACACCAA ACCCCATCTC 
CGAGAAATAG TCATTTCTCC TGGACAAACT CTGAGATTAC CAGAAAACAA TGCTACTGCT 
GGTTGGACGC TTCCTTCCCC AGTTTTCTTT TGTGAACACC AACTAATTCT TAGTACCTCT 
CCCTTCACTG AAACCCTTGC AGCCTTGGGA ATTACCAAGT ATCCTAGTTC TGATCAACAG 
CCCATTAGCC CTTTAGTTAA TGCTTTAGAA GTTGCCCAAG CCTTGCTTCA AGATTTACAT 
AATGCCAGTA AAATTAAAGT AGAAATTACT GGAACTGCTG CGGACTCTTA TGTATTAGAT 
GTGAATAATT GGGCAAGCCT TAACTTTAGT TTCCAAGTGG TTTCAACCCT CCAATTTTAG

Protein sequence

MLIMKRRAFL ERIGSILAVL GLTEAEWLTL GNRYYQALAQ PKPRKLALLI GINQYPQSPV 
LSGCLTDVEL QKELLIHRFG FASADILTLT EEQASREFIE AACLDHLGNQ AKADDTVVFH 
FSGYGTRVKL ATFPETVENA LIPFDVDTQN QLSVNYLLEQ TLLLLLRSLP TNRVTTILDT 
SYYAPSTLQT PALKFRSRPE SSVAKLALEE LAFLKQQQTQ NPALNNAMLL KATSTENQQA 
GELLFGNFSA GLFTYVLTQY LWETTPATTI QILLSHIRSS IYKLGSKQQP GLWTEKKNPQ 
SGLIIDNFPL VSSDAEGVVI ALNEDGKAVE LWLGGLPLQV LEYYGVNSRL ITPTGEQLIF 
KSHNGLTAKA QISNQDATTS LQVGQVVQEA VRVLPRNISL TVLLDSGLER IERVDATSAF 
ATITRIVNIT ATEQKPDYIF GKLKNIPSRY GLFSLDGEVI LNTAGETGEA VKVAVQRLTP 
KFSTLLAAKL WRLTENQVSS RLAVKATLEM VNNISPGVVM QQQTWRGFSG KSTTHKALTT 
PGTAIPTVPV GSTMQYRVEN LSARPIYLML VGLNNSRSAI TFYPWEVSKL ADTSDTKPHL 
REIVISPGQT LRLPENNATA GWTLPSPVFF CEHQLILSTS PFTETLAALG ITKYPSSDQQ 
PISPLVNALE VAQALLQDLH NASKIKVEIT GTAADSYVLD VNNWASLNFS FQVVSTLQF