Gene Aazo_2991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2991
Symbol
ID	9340794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3081833
End bp	3083173
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	43%
IMG OID
Product	carboxyl-terminal protease
Protein accession	YP_003721909
Protein GI	298491732
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAAT CTGCGAAACG TTACTCACCG CTTCAAGCAG TCTTAATTGG TGGAGCGATG 
GCAACAACTG CCACTATATC TCTATTTGGT CAAGCTTGGA CTCGGTGTGT TCATGCTGCT 
TTACAAGATA GTCCTAAAGC GTTGGTTTAC CAAGTATGGC AACTGGTGAA TCGTGAATAT 
GTTGATAGCA AATTTAATCA ACAAGATTGG GAAGCAACCA GGCAGAGCCT ATTAAGCAAA 
GACTATACTT CCAATGATCA AGCTTATGTA GCGATCCGCG AAGCCCTTCA AAAATTGGGA 
GATCCATACA CACGTTTTAT GGATCCCAAA CAATTCACAG CCTTGACTAC TCAAACATCT 
GGGGAAGTTT CTGGGATTGG TATTCGCATG GAAGTCAATG AAAAAACCAA GCGATTAACC 
ATTGTCGAAG CTATAGAAAA TTCTCCTGCG GTAAAAGCTG GTGTTAAGTC AGGTGATGAG 
ATCTTAGCAA TTGATGGTAA AAGCACTCTC AAAATGAAAG TGGATGAGGC ATCTAATTTA 
ATTCGCGGTA AGGCTGGTAC TGGTATAACT TTGCGGTTGG GACGACCAGG AAAAAATCAG 
TTTGATTTGA AGCTGACAAG GGCAACTATC GAACTTCCTA CTGTGAATTA CACTCTTAAA 
CAAGAGGGTG GTCGTCGGAT TGGCTATATA AGATTGCGGG AGTTTAGCGC CCACGCGGCT 
GATCAAATGC GTCGAGCTAT TGGCAATTTG AACAACAAAA AAGTCGATTC CTATGTATTA 
GATTTGCGAG GAAACCCAGG TGGTTTGTTG CAAGCTAGTA TTGAAATAGC GCGGATGTGG 
CTAGATAATG GTGGCATTGT CAAGACTGTA GATCGTGTGG GAGGTAGTGA AGAAACTAAA 
GCCAATCGCA CAGCCTTGAC AAACCAACCT TTAGCTATTC TCGTTGATGG TAATTCCGCT 
AGTGCTAGTG AAATTCTCAC GGGGGCTCTC AAGGATAATA AACGGGCATT AGTTGTCGGT 
AGTCAAACTT TTGGTAAAGC TTTGGTGCAA TCAGTACATG AACTTACTGA TGGTTCTGGG 
TTAGCAGTGA CTATTGCTCA CTACTACACC CCCAAAGGTA CGGATATCAA TCACAAGGGC 
ATTACACCTG ATATTCAGCT AGATTTGACG GAGGCTCAAG AACGTCAGTT AGCTGCTAAT 
CCAGATCTAA TTGCAACTGT CAATGATCCA CAATATGCCC GTGCTATTGT TGCTCTGTCT 
AATACAAAGT TTGCCCAACC TATGACACCT CCTCAAAGTT CTCAACCTCT AAGCATTCGA 
GCTGAAGATT TGAAATTTTA A

Protein sequence

MNQSAKRYSP LQAVLIGGAM ATTATISLFG QAWTRCVHAA LQDSPKALVY QVWQLVNREY 
VDSKFNQQDW EATRQSLLSK DYTSNDQAYV AIREALQKLG DPYTRFMDPK QFTALTTQTS 
GEVSGIGIRM EVNEKTKRLT IVEAIENSPA VKAGVKSGDE ILAIDGKSTL KMKVDEASNL 
IRGKAGTGIT LRLGRPGKNQ FDLKLTRATI ELPTVNYTLK QEGGRRIGYI RLREFSAHAA 
DQMRRAIGNL NNKKVDSYVL DLRGNPGGLL QASIEIARMW LDNGGIVKTV DRVGGSEETK 
ANRTALTNQP LAILVDGNSA SASEILTGAL KDNKRALVVG SQTFGKALVQ SVHELTDGSG 
LAVTIAHYYT PKGTDINHKG ITPDIQLDLT EAQERQLAAN PDLIATVNDP QYARAIVALS 
NTKFAQPMTP PQSSQPLSIR AEDLKF