Gene Aazo_2761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2761
Symbol
ID	9340561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	2843518
End bp	2845107
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	46%
IMG OID
Product	peptidase M23
Protein accession	YP_003721745
Protein GI	298491568
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.758494
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAGC GCCATAAATC TGCCGATAAC CGCTTAGATG ATTTGCGGAC TCAAGGTTTA 
ATAAAGAGAC GCTTTGCGTC TACATTATCA GCACAGAGCC TTGGTTGGTT GAGTAGTGTT 
AGCCTCCTTA GTGGTGGCCT TGTATTTGCT CAAACGGAAT CATCAGTAGA TAACATCGTT 
CCCACTATTG AGAATTCCCG GCCAATAGTT GTTAAAGATA CAAGGAGAAA AGAGACTGCT 
GCTGAAGCTA CACCATCAGA GCCAGATTTT GCTGAAAGAC GAGTCAGACT CAAAAAGAAA 
CTCCATCAGA CACAAGTTTC CCAATCAGCA GAACCAGTCA GAACTTCCAA ACCCAAAGTA 
GAGAATTCTG AACCTAAAGT CACGGAGAGA ACGTCTGAAC CCAAAGTGGA GAATTATGAA 
TCTAAAGTCA CGGAGAGAAC GTCTGAACCC AAAGTTGAAA CTCCGGCTAA TTCAGTAGCT 
GAAAAACCCT CAGAAGTGGC TCAACCACCG AATAACTCCA ACGATACTGG TAGCAGGACA 
ACCGCAGGGA AAAACAAAGA TTACAATAAC GCCTTAGTTG ACCCTACAGA TTACAACAAT 
ACTCCAACTG CTAAGTATGA AGCTCCCAGT TCTGTAACAA CTACAGAACG TGGTGGTGGT 
TGTCAAGCAG TTTTCTCACA AAAAGAAATT GCTGCTGGTG CTTGCGGTAA AAAACCTATT 
GATGGTCCCC GTGTGGCTGA TTCTCCCAAG AAAACAGCAC CCACTTGGAT TCAAAAAAGC 
GAAACTGCTA GTTTGGAAAA AGCACCCAGA TTCGAGAAAG TAGCGGCTGA GTCCAAATCA 
GCAACTCCCA GTGTGGTTAA GACTGTTGCT AGTGCTGTGA ATAATAATAC CAGTTGGCGT 
AATACCAACA TTGGTTCTAG CAGTCATACA AAAACTGCAT ACCGCCCTAA TCGGTTTATT 
CCTAATCCCA GCGAATTTTC ACCGACTACA ATAGTGAATG GGACACCTAT CGCCCCCAGT 
TTTGGTACTT TACCACCACC AATGGCTGAC GATAATGTGG CACCCCGTGT CAGCACTATT 
TCCTATGATT TTGCGCTGGC ATCGATTTTA CCACAAATAC CTTATAGTAA CACCTTAGGT 
TACCGTAGCG GGTCGGGAAT GATGTTTCCT TTATCTTTTG CTGCACCCAT TACTTCTGTA 
TTTGGTTGGC GGGTTCATCC CATTACTGGG GATAGACGTT TCCACGCTGG TACAGACTTG 
GGTGCGCCCA CAGGGACACC AATTTTGGCA GCGGCTAAAG GTCAAGTGGA TACTGCTGAC 
TGGATGGGTG GCTATGGTTT AGCAGTAACT ATTAATCACA ATTCTGCTCA ACAAACCCTC 
TATGGTCATA TGTCAGAAAT CTTTGTCAGT CCTGGTCAGT CGGTAGAACC AGGAACTGTA 
ATTGGCCGAG TCGGCAGCAC TGGCAACTCT ACAGGCCCTC ACCTGCACTT TGAAGTCCGC 
CACCTGACCC AAAACGGTTG GGTTGCTGTT GACCCTGGTG TACAACTACA AGCTGGCCTC 
AGCAACACAA GCAAGATAGG GGTTAGGTGA

Protein sequence

MTQRHKSADN RLDDLRTQGL IKRRFASTLS AQSLGWLSSV SLLSGGLVFA QTESSVDNIV 
PTIENSRPIV VKDTRRKETA AEATPSEPDF AERRVRLKKK LHQTQVSQSA EPVRTSKPKV 
ENSEPKVTER TSEPKVENYE SKVTERTSEP KVETPANSVA EKPSEVAQPP NNSNDTGSRT 
TAGKNKDYNN ALVDPTDYNN TPTAKYEAPS SVTTTERGGG CQAVFSQKEI AAGACGKKPI 
DGPRVADSPK KTAPTWIQKS ETASLEKAPR FEKVAAESKS ATPSVVKTVA SAVNNNTSWR 
NTNIGSSSHT KTAYRPNRFI PNPSEFSPTT IVNGTPIAPS FGTLPPPMAD DNVAPRVSTI 
SYDFALASIL PQIPYSNTLG YRSGSGMMFP LSFAAPITSV FGWRVHPITG DRRFHAGTDL 
GAPTGTPILA AAKGQVDTAD WMGGYGLAVT INHNSAQQTL YGHMSEIFVS PGQSVEPGTV 
IGRVGSTGNS TGPHLHFEVR HLTQNGWVAV DPGVQLQAGL SNTSKIGVR