Gene Aazo_3762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3762
Symbol
ID	9341567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	3820612
End bp	3822396
Gene Length	1785 bp
Protein Length	594 aa
Translation table	11
GC content	36%
IMG OID
Product	peptidase M61 domain-containing protein
Protein accession	YP_003722425
Protein GI	298492248
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0112026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGAAC TAATAGCAGT TAGTTTGAAA ACTCAAGTTC AGGAAATTGA ACCAGCAATT 
CATTACTGGG TAGCAATGCC CCAACCAGAA AATCATCTGT TTGAGGTGAC TTTACATCTT 
GTAGGCTACC CATTACCAAT TCTTGATTTG AAAATGCCAG TATGGACACC AGGGTCTTAC 
TTGGTGCGAG AATACGCTAA GAATTTACAA AACTTTGCTG CCTTTGCTGG GTCTAAACCT 
TTAAATTGGC GAAAAATTAG TAAAAATCAT TGGCAAATTG AAAAGGGAGA TGTTTCTGAA 
GTAGTTCTGG GTTACCGCGT TTTTGCAAAT GAGTTGTCAG TACGCACAAA TCATTTGGAT 
GCTACCCATG GTTATTTTAA CGGTGCGGCG CTGTTTTTAC GAATTCCTGG TTGGGAAGAA 
CAACCAATTC ATATTACCAT TGTCCCACCA AACCCTGAAT GGCAAATAAC GACAGGTTTA 
TCATCAATTA CTGAAGAAAC TAATACTTTT TTAGCTGCGG ATTTTGATAC TCTTGTTGAT 
ACTCCTTTTG AGATTGGTAA CCATCAATTG TTTAATTTTG AGGTATTGGG AAAACCTCAT 
GAGTTAGCAA TCTGGGGACA GGGAAACTGT AAACCCCAAA AGATATTAGA GGACTTTAAG 
AGAATTATTG AATATGAAGC AGAAATATTT GGCGATTTGC CATATCAAAA GTATGTGTTT 
CTGCTGCATT TATTCAACCA AGCTTATGGT GGATTAGAAC ATAAAAATTC CTGTTCATTA 
CTTTATCATC GGTTTGGATT TCGTCTGAAA GATAAATATG AACGTTTTAT TCAATTAGTA 
GCGCATGAAT TTTTCCATTT GTGGAATGTG AAGCGAATTC GCCCCAAAGA TTTCGAGGTT 
TTTAATTATG ATCAAGAGAA CTATACACAG TCTCTTTGGT TTTGTGAGGG AACCACAAGT 
TACTATGATT TGATAATTCC TTTCCGGGCA GGAATTTATG ATATCAAATC TTATTTTCAT 
CATTTAGATC AAGAAATTAC CAAATATCAA TTAACACCAG GACGAAACGT ACAACATCTT 
TCTGAGTCCA GTTTTGATGC TTGGATTAAA CTTTATCGTC CAGATGCTAA TAGTGCTAAT 
TCCCAAATTT CTTACTATTT GAAGGGCGAA ATGGTATCGC TATTGCTGGA TTTATTGATT 
CGTTCTCGTC ATCATAATCA GCTTTCTCTT GATGATGTTA TGCTGAAAAT GTGGGAACAA 
TTTGGTAAGG CTGAAATTGG TTATACTCCA GAACAACTAC AAGAAGTCAT TGAATCTGTG 
GCTGGAATGG ATTTATCGGA TTTCTTTAAA AGCTACATTC ATGGACTAGA TGATTTACCT 
TTTAATGATT ATTTAGAACC TTTTGGGTTG CAATTGGTAG AAGAATCTGA ACAAGAACCT 
TATTTGGGTG TGAAAATAAA AACTGAATAT GGACGAGAAA TAATTAAGTT TGTGGAAATG 
GGGTCCCCTG CAAACATTGT GGGAATTGAT GCTGGTGATG AGTTATTAGC AATTGATGGA 
ATTAAGGTAG GAACAAGCCA GTTGAGTGAT CGTTTGCACG ATTACCAACC TTACGATACT 
ATCCAAATCA CGGTTTTCCA TCAAGATGAA TTGCGTAACT ATTCTGTAAG TTTAGGAAAA 
GAACATCCGA CTAAATATCA GTTGCGGCCA GTAAAAAATC CTAATACTAC TCAGCAAGAA 
AATTTTTCGG GTTGGTTAGG TGTGCAGTTG TCGAGTTTTT GGTAA

Protein sequence

MIELIAVSLK TQVQEIEPAI HYWVAMPQPE NHLFEVTLHL VGYPLPILDL KMPVWTPGSY 
LVREYAKNLQ NFAAFAGSKP LNWRKISKNH WQIEKGDVSE VVLGYRVFAN ELSVRTNHLD 
ATHGYFNGAA LFLRIPGWEE QPIHITIVPP NPEWQITTGL SSITEETNTF LAADFDTLVD 
TPFEIGNHQL FNFEVLGKPH ELAIWGQGNC KPQKILEDFK RIIEYEAEIF GDLPYQKYVF 
LLHLFNQAYG GLEHKNSCSL LYHRFGFRLK DKYERFIQLV AHEFFHLWNV KRIRPKDFEV 
FNYDQENYTQ SLWFCEGTTS YYDLIIPFRA GIYDIKSYFH HLDQEITKYQ LTPGRNVQHL 
SESSFDAWIK LYRPDANSAN SQISYYLKGE MVSLLLDLLI RSRHHNQLSL DDVMLKMWEQ 
FGKAEIGYTP EQLQEVIESV AGMDLSDFFK SYIHGLDDLP FNDYLEPFGL QLVEESEQEP 
YLGVKIKTEY GREIIKFVEM GSPANIVGID AGDELLAIDG IKVGTSQLSD RLHDYQPYDT 
IQITVFHQDE LRNYSVSLGK EHPTKYQLRP VKNPNTTQQE NFSGWLGVQL SSFW