Gene Aazo_1032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1032
Symbol
ID	9338827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	1103808
End bp	1105088
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	38%
IMG OID
Product	peptidase M16 domain-containing protein
Protein accession	YP_003720518
Protein GI	298490341
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.856018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACATCAA CTCTGTTAAA ATTTCCTCGA CTTAATGCTC CCAAGGTGCA TCATTTACCA 
AATGGTTTAA CCATCATCGC CGAGCAAATG CCAGTACCAG CAGTTAACCT TAATCTATGG 
GTAAACATCG GTTCTGCTGT GGAGTTAGAT GCTATTAATG GCATGGCTCA TTTTTTAGAA 
CATATTGTTT TTAAGGGAAC AGAGAGACTA GCCAGTGGTG AGTTTGAACG TCGAATTGAA 
GAACGCGGCG CTGTTACTAA TGCCGCTACT AGCCAAGATT ATACACACTA TTATATTACG 
ACTGCGCCGA AAGACTTTGC AGAATTAGCA CCATTGCAAA TAGATGTTGT TTGTAATCCT 
AGTATTCCTG ATGATGCTTT TGAGAGAGAA CGCTTAGTAG TTTTGGAAGA AATCAGACGT 
TCACAAGATA ACCCCAGACG GCGGATTTAT CGCCGCACAA TGGAAACCGC TTTTGATGTT 
TTACCTTATC GTCGTCCGGT ACTCGGTCCA GAAGCAGTAA TTTCTCAAGT TACACCTCAG 
CAAATGCGAG ATTTTCACCA TACCTGGTAT CAACCGTCTT CTATAACTGC GGTTGCCGTC 
GGTAATCTAC CAGTAGAAGA ATTAATAGAA ATTATTGCCG AAGAATTTAG TAAAAATAGT 
CAAAAATCAA AAATTAATAA TCAACAATTA ACCGTTAGTC AAGAACCTGC ATTTACAGAA 
ATTGTGCGTC GGGAATTTAC TGATGAGAGT GTACAACAAG CCAGATTAAT AATCCTATGG 
CGAGTTCCTG GACTCATGGA ATTAGATGAA ACATACTCTT TAGATGTGTT AGCAGGAATT 
TTAGGACATG GACGTACATC TAGATTAGTC CATGATTTGC GAGAAGAAAG AGGACTTGTT 
TCCTCAATTG CTGTTAGTAA TATTAATAAT CGACTGCAAG GGATATTTTC TATTTCTGCT 
AAGTGTGAAG TAGATGATTT AGAAGCAGTA GAAGCTGCAA TTGCTAAACA TTTGTATACA 
ATACAAACAG AATTAGTAAA AGAATCAGAA ATTTATCGTG TACGGCGACG GGTAGCCAAT 
CGGTTTATAT TTGGGAATGA AACACCAAGT GAGCGCTCCG GTTTGTATGG TTATTATCAA 
TCTTTAATAG GCGACCTAGA AGCAGCATTT AATTATCCCC AATATATACA AGCTCAAAAT 
ACAAATAACT TAATCCAAGC TGCACAGAAA TATCTTGACC CCAACGCTTA TGGTGTAGTT 
GTGATCAAAC CTGTTAAGTG A

Protein sequence

MTSTLLKFPR LNAPKVHHLP NGLTIIAEQM PVPAVNLNLW VNIGSAVELD AINGMAHFLE 
HIVFKGTERL ASGEFERRIE ERGAVTNAAT SQDYTHYYIT TAPKDFAELA PLQIDVVCNP 
SIPDDAFERE RLVVLEEIRR SQDNPRRRIY RRTMETAFDV LPYRRPVLGP EAVISQVTPQ 
QMRDFHHTWY QPSSITAVAV GNLPVEELIE IIAEEFSKNS QKSKINNQQL TVSQEPAFTE 
IVRREFTDES VQQARLIILW RVPGLMELDE TYSLDVLAGI LGHGRTSRLV HDLREERGLV 
SSIAVSNINN RLQGIFSISA KCEVDDLEAV EAAIAKHLYT IQTELVKESE IYRVRRRVAN 
RFIFGNETPS ERSGLYGYYQ SLIGDLEAAF NYPQYIQAQN TNNLIQAAQK YLDPNAYGVV 
VIKPVK