Gene Aazo_0766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0766
Symbol
ID	9338552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	809512
End bp	810891
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	42%
IMG OID
Product	peptidase M24
Protein accession	YP_003720325
Protein GI	298490148
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.498025
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACACCT CCAGCATCTT TCTAGAAACC CTCCACCATC GTCGTCAAAG ACTGGCAGAA 
CTGATAGATT TTCCAGCAAT TCTCTGGTCT GGTGGTAGCA GTTCCCGCAA CTTTCCAGCT 
AATGTCTTCC CCTTTCGCCC TAGTAGTCAT TTCCTCTATT TTGGAGGAAT TCCTCTCCAA 
AATGCTGCCA TTCGCCTAGA AAGTGGGAAG CTACAACTAT TTATAGATGA CCCTAACCCC 
AGTAGCACCC TGTGGCACGG AGAAACACCA ACCCGAGAGG AAATAGCCGC AAATATAGGT 
GCAGATGATG CTAGACCGAT CGCAGAATTA GAAGATTATT TGGAGAATGC TGCCACTATT 
CCTGTTCAAG ATGCGGCAAC TTCGACAGAG CAATCACTAT TATTACATAG ATGGCTTTTA 
CCCCAACAAC CACCCCAAGG AATTGATTTA GAATTAGCTA AAGCTATTGT TTCCTTGCGT 
CTCACCCACG ATGCAGCGGC ATTAGTAGAA TTGCGTAAAG CTGTGGCGGT GAGTGTGGAA 
GCACACAAAG CGGGAATGGT TGTTACATCT ACAGCAAAAC TAGAAGCAGA AGTTCGGGCG 
GCAATGGAAG CAGTGATTAT AGGTTATAAT ATGACAACTG CTTACGCCAG CATTGTGACA 
GTGCATGGTG AATTCTTACA CAATAACCAC TATTATCACT CGTTAGAACC CGGAGATTTA 
CTTTTAGCCG ATGTGGGTGC AGAAACTGAA ACAGGTTGGG CTGCTGATAT TACCCGGACG 
TGGCCTGTAT CTGGTAAGTT TTCATCTACC CAAAGAGATA TTTATGATAT TGTATTAGCT 
GCCCATGATG CTTGTTTTGA AAAAATAGCT CCTGGTGTGG AATATGGGGA AATTCATCTT 
ATAGCTGCAA CTGTGATTAC GGAAGGTTTG GTGGATTTGG GAATTTTACA AGGTAAGCCA 
GAAGATTTGG TAAAAATGGA TCTTCATGCA TTATTTTTCC CCCACGGAAT TGGGCACTTA 
TTAGGTTTAG ATGTCCATGA TATGGAGGAT TTGGGGGATT TAGCTGGGTA TGAAGAGGGA 
AGAAAAAGAA GTGATCGATT TGGGTTAAGT TACCTGCGTT TGAATCGTCC TCTGCGTGCA 
GGAATGTTAG TAACTATTGA ACCTGGATTT TATCAAGTTC CCGGAATTTT AAATGATCCA 
AAAATTCGTG ATCAATATGA ATATTTAATC AATTGGGAAC GCTTAGAACA ATTTGCAGAT 
GTGCGTGGAA TTCGCATTGA AGATGATGTT CTAGTTACAG AATCAGGTAG CGAAGTCTTA 
ACAGCCGCAT TACCAAATCA AGCTAATAAT ATAGAAGATT TGTTAAAACT TCCAAAATAA

Protein sequence

MHTSSIFLET LHHRRQRLAE LIDFPAILWS GGSSSRNFPA NVFPFRPSSH FLYFGGIPLQ 
NAAIRLESGK LQLFIDDPNP SSTLWHGETP TREEIAANIG ADDARPIAEL EDYLENAATI 
PVQDAATSTE QSLLLHRWLL PQQPPQGIDL ELAKAIVSLR LTHDAAALVE LRKAVAVSVE 
AHKAGMVVTS TAKLEAEVRA AMEAVIIGYN MTTAYASIVT VHGEFLHNNH YYHSLEPGDL 
LLADVGAETE TGWAADITRT WPVSGKFSST QRDIYDIVLA AHDACFEKIA PGVEYGEIHL 
IAATVITEGL VDLGILQGKP EDLVKMDLHA LFFPHGIGHL LGLDVHDMED LGDLAGYEEG 
RKRSDRFGLS YLRLNRPLRA GMLVTIEPGF YQVPGILNDP KIRDQYEYLI NWERLEQFAD 
VRGIRIEDDV LVTESGSEVL TAALPNQANN IEDLLKLPK