Gene Aazo_5174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5174
Symbol
ID	9342981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	5297703
End bp	5299754
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	46%
IMG OID
Product	exoribonuclease II
Protein accession	YP_003723348
Protein GI	298493171
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAGAAGG GGACGCTAGT TGAATTTAGG GTTCAAGGCG ATCGCCGTCT GGGAGTGGTA 
GATCGTCCAG ACGGAAAGAC CCGTTGGTTT GTAGTAGATG AACGAGGTCA ATCCCACAGC 
CTCGCGCCTC GACAACTAAC CTATACAGTA AACGGGGAAA CTTACAAACC CTCAGATATT 
GCCCAATTTT CAGAACAAGT CAAACCGTAC CTAGATCCAT CTAGCTTAGA AGTGGCTTGG 
GAATTATTGG TGGAAGATGG AGAAACAGTC ACCCCTAGCC AAATGGCTAA TTTGCTGTTT 
TCACAATCTG AACCGCCATA CTGTTACGCT GCTCATTGCT TGTTATCAGA AGACAAACTC 
TATTTCAAGC AAAAAGGTGA AGCTTATGAA CCCCGCAGCG CAGCACAAGT AGCAGAACGT 
AAGCATCAAA TAGAAGTAGA AGCGCAAAAA GCTAAGGGAC AGCAGGAATT TTTAGCGCGT 
GTAGAACAGG CACTCAAGGG TGAAGCAGTA GAATGGCAAC GGCAAGACCG TCAGCGTTTG 
GAAGCATTAG AAAAGTATGC ATCCTTAGTG GCGGATATTG TGCGGACGGG GGTAAACTCC 
GATTCTTTAG CCCGCGCTTA CCCACCTCCA GCCCCAGTCT TAGAAACCAT GAATATGCTG 
GGACGTTCTG GTACACCTCT AGCAGCCTTT CAACTGTTGA TCGACTTGGG TTGGTGGGGT 
CCGCATGAGA ACCTGTTCCT GCGTCGTTCT TCAATTCCCG TCCAGTTTCC CAACAAGGTA 
TTAGAAGTGG CGCAACAACG CTTGGATTTT CCACCAACTG ACTTAGATAC AAATCGACTG 
GATCTAACTC ATCTCAAGGT ATACACAATT GATGATGAAA GTACCACGGA AATAGATGAT 
GGTCTAAGTT GGGAAGTATT ACTAGATGGA CAGGAACGGC TATGGGTGCA TATTGCTGAC 
CCTACGCGGT GGTTAATGCC AGAAGATGAA TTAGATTTAG AAGCCAGAAA GCGGGGAAGC 
ACTGTTTATT TACCGACGGG GATGATTCCC ATGTTCCCGG AGGTACTAGC AACTGGTCCG 
ATGAGTTTGG TACAGGGGAA AATTTGTTAC TCCCTCAGCT TTGGCATAGT TTTGGACGAA 
ACTGGGGCTG TGGAAGATTA CTGTATTCAT GCCAGCTTGA TGAAGCCTAC CTATCGTCTC 
ACCTATGAAG ATGTAGATGA GATGCTGGAA TTAGGGGTAG AAGCAGAACC AGAAATTGCT 
GCGATCGCAA ATTGGGCAAA AAAGCGTAAA ACCTGGAGAT ATAACCAAGG AGCCATCAGC 
ATCAATATGC CAGAGGCAAT GATTAAAGTC AAAGGCGATG ATGTCACCAT AGATATTTTA 
GATGATTCCT CCTCCCGGCA ATTAGTTGCC GAAATGATGA TTCTTGCGGG AGAAGTAGCC 
GCACGTTACG GTCAAACCCA TAACATTCCC CTACCCTTCC GTGGTCAACC CCAACCAGAA 
CTACCACCAG AAGAAGAATT ACTCCTACTT CCCGCAGGCT TTGTTCGTGC CTGTGCCATG 
CGTCGGTGTA TGCCCAAGAG CGAAATGAGT ATTACTCCTG TGCGCCATGC TGGTTTGGGA 
CTAGATACCT ACACCCAAGC AACTTCACCA ATTCGTCGTT ACAGCGACCT ATTAACCCAC 
TTCCAACTCA AGGCACACCT GCGGGGTGAA GATTTGCCCT TTTCAGCCGA ACAACTCAAA 
GAAGTGATGA TGACCGTCAC CACTACCACC CAAGAAGTGA CAATGGTGGA ACGACAAACT 
AACAGATATT ATGCTCTAGA ATATTTGCGT CGTCATCCTG AACAGATATG GCAAATCACA 
GTTTTGATGT GGTTACGAGA AGATAGCAAT TTAGCATTAA TTCTGTTAGA AGATTTAGGT 
TTACAATTGC CAATGGCCTT TAGAAGGACG GTCAATTTAG GAGAACAATT ATTAGTGAAA 
GTGAGCCTTG CTGATCCACA GAAAGATATG ATTCAGTTTC AAGAAATAAT TTATCAAGAA 
GCTGCTCTTT AA

Protein sequence

MEKGTLVEFR VQGDRRLGVV DRPDGKTRWF VVDERGQSHS LAPRQLTYTV NGETYKPSDI 
AQFSEQVKPY LDPSSLEVAW ELLVEDGETV TPSQMANLLF SQSEPPYCYA AHCLLSEDKL 
YFKQKGEAYE PRSAAQVAER KHQIEVEAQK AKGQQEFLAR VEQALKGEAV EWQRQDRQRL 
EALEKYASLV ADIVRTGVNS DSLARAYPPP APVLETMNML GRSGTPLAAF QLLIDLGWWG 
PHENLFLRRS SIPVQFPNKV LEVAQQRLDF PPTDLDTNRL DLTHLKVYTI DDESTTEIDD 
GLSWEVLLDG QERLWVHIAD PTRWLMPEDE LDLEARKRGS TVYLPTGMIP MFPEVLATGP 
MSLVQGKICY SLSFGIVLDE TGAVEDYCIH ASLMKPTYRL TYEDVDEMLE LGVEAEPEIA 
AIANWAKKRK TWRYNQGAIS INMPEAMIKV KGDDVTIDIL DDSSSRQLVA EMMILAGEVA 
ARYGQTHNIP LPFRGQPQPE LPPEEELLLL PAGFVRACAM RRCMPKSEMS ITPVRHAGLG 
LDTYTQATSP IRRYSDLLTH FQLKAHLRGE DLPFSAEQLK EVMMTVTTTT QEVTMVERQT 
NRYYALEYLR RHPEQIWQIT VLMWLREDSN LALILLEDLG LQLPMAFRRT VNLGEQLLVK 
VSLADPQKDM IQFQEIIYQE AAL