Gene Aazo_1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1000
Symbol
ID	9338795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	1058042
End bp	1060489
Gene Length	2448 bp
Protein Length	815 aa
Translation table	11
GC content	44%
IMG OID
Product	ATPase AAA-2 domain-containing protein
Protein accession	YP_003720495
Protein GI	298490318
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0499037
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGAAC ACTTCACGTC CGAAGCCATT AGGGTAATTA TGTTAGCTCA GGAGGAAGCA 
CGCCGCCTGG GACACAATTT CGTAGGCACT GAACAAATTC TCCTGGGTTT AATGGGAGAA 
GGAACCGGAG TGGCTGCGAA AGTGCTAGCT GAGTTGGGTG TTACCCTGAA AGATGCGCGT 
CGGGAAGTAG AGAAAATTAT TGGTCGGGGT TCTGGTTTTG TTCCGCCGGA AATTCCTTTT 
ACACCAAAAG TAAAAAGTCT GTTTGAGCAA TCTTTTAGAG AAGCTCATAG TCTTGGACAC 
AACTACATAA ACACTGAACA TTTATTGTTA GGTTTAACTG AAGCCGGGGA AGGAGTGGCG 
GCCAAAGTTC TGCAAAATTT GGGAGTTGAG TTGCAAGGTA TCCGTGCTGC TGTTATTAGT 
CGTTTGGGTG AAGATGTAAC TGTTTTCGCA GGCACTGTAA GCGGGTCTAA GCGTAATCAA 
AACCTAAGTA TAGAAGAGTT TGGTAGAAAT CTGACCAAAA TGGCTCAGGA TGGCAAGCTT 
GATCCTGTTG TTGGTCGTCA ACGAGAAATT GAGCGCACGG TGCAAATTTT GGGTCGTCGC 
ACCAAAAATA ACCCGGTTTT AATTGGAGAA CCAGGTGTTG GTAAAACTGC TATCGCAGAA 
GGTTTAGCCC AACGTATCAT TAACCAAGAT GTACCAGAAG TGCTGTTGAA CAAGCAAGTC 
ATCAGTCTGG ACATGGGTTT ACTAGTAGCT GGAACTCGTT TCCGTGGCGA CTTTGAGGAA 
CGCCTGAAAA AAATCATGGA TGAAATTCGA TCAGAAGGCA ATATCATCCT GGTGATTGAT 
GAAATTCACA CCTTAGTCGG TGCAGGTGGT ACAGAAGGCG GTTTAGATGC AGCTAACATC 
CTGAAACCAG CTTTAGCAAG AGGTGAACTC CAATGTATTG GGGCAACCAC CTTGGATGAA 
TACCGTAAAC ACATTGAGCG TGATGCGGCT TTAGAACGGC GTTTTCAACC AATTTTGGTG 
GGAGAACCTT CTGTAGGAGA AACCATTGAG ATTCTCTATG GGTTGCGTAG TGCTTATGAA 
CAACATCATA AAGTCACCAT CTCTGATGCA GCTGTAGTAG TAGCAGCACA GTTATCCGAT 
AGATATATTA GTGATCGCTT CCTACCGGAC AAAGCTATAG ACTTAATTGA TGAAGCTGGT 
TCTCGTGTAC GTTTACGTCA CTCCCGCATC ATCAACAATA AAGAAATCAA ACTGCAACTC 
AAAAACATCA GCAAAGACAA AGCAGAAGCT ATCAGAGTTC AGGATTTTGG TAAAGCTAGT 
AAACTCAATC AAGAAGAACT AGAACTTCAG GCCAAAATAG ACTTAGAAGA TAACCTGCAA 
ACAGTTAAAG CGATCGTTGA CGAAGAAGAC ATCGCCCAAA TCGTTGCCTC TTGGACAGGT 
GTCCCAGTTA ACAAACTCAC CGAATCAGAA TCAGAGTTAC TACTGCACCT AGAAGACACC 
CTGCACAAAC GCCTCATCGG TCAAGAACAA GCAGTTGCAG CCGTTTCTCG TTCCATCCGT 
CGCGCCCGTG TCGGCTTAAA GAATCCTAAG CGTCCCATCG CCAGCTTTAT CTTCTCTGGT 
CCGACAGGAG TAGGGAAAAC CGAACTAGCC AAAGCCCTAG CCGCTTACTT CTTCGGTGCA 
GGAGATTCCA TGATTCGCTT GGATATGTCC GAATACATGG AAAGCCATAA CGTTTCCAAA 
CTTATCGGTT CACCTCCAGG TTACGTAGGC TACGACGAAG GCGGACAACT TACAGAAGCA 
GTAAGACGTA AACCATACAC GGTGCTACTT TTCGACGAAA TTGAAAAAGC GCACTCTGAT 
GTATTTAATA TGCTGCTACA AATCTTGGAT GAAGGACACC TCACCGATGC TAAAGGTCGT 
AAAGTAGACT TCAAGAACAC CTTAATCATC TTAACTTCCA ATATTGGTTC TAAGGTAATT 
GAGAAAGGCG GTATCAGTTT AGGCTTTGAA TTTGATAATC AAGCCGACGC TAGTTATAAC 
GGTATCCGTA AATTGGTAAA TGAAGAACTG AAAGCTTATT TCCGTCCTGA ATTCCTCAAC 
CGTGTTGATG ATATTATCGT CTTCACCCAG TTGAATAAAG AAGAAGTTAA GCAAATCGCC 
GAAATCATGC TGCATGATGT TGCTAACCGA TTAAAAGACC GAGGAATTAA ACTCGAAGTC 
ACAGAAAGCT TCAAAGAACT GGTTGTCAGA GAAGGTTATG ACCCAAGCTA CGGTGCTAGA 
CCTTTACGTC GAGCTATTAT GCGTCTGTTA GAAGATTCTT TAGCTGAGGC TATCTTATCT 
AGTCACATCC TTGAAGGTGA TACAGCCATT GTCGATGTTG ATGATGATGG TCAGGTAACA 
GTCAGAAAAG CAGAAACCCG CGAATTCCTG TTAGCTAATG TTGGCTAA

Protein sequence

MFEHFTSEAI RVIMLAQEEA RRLGHNFVGT EQILLGLMGE GTGVAAKVLA ELGVTLKDAR 
REVEKIIGRG SGFVPPEIPF TPKVKSLFEQ SFREAHSLGH NYINTEHLLL GLTEAGEGVA 
AKVLQNLGVE LQGIRAAVIS RLGEDVTVFA GTVSGSKRNQ NLSIEEFGRN LTKMAQDGKL 
DPVVGRQREI ERTVQILGRR TKNNPVLIGE PGVGKTAIAE GLAQRIINQD VPEVLLNKQV 
ISLDMGLLVA GTRFRGDFEE RLKKIMDEIR SEGNIILVID EIHTLVGAGG TEGGLDAANI 
LKPALARGEL QCIGATTLDE YRKHIERDAA LERRFQPILV GEPSVGETIE ILYGLRSAYE 
QHHKVTISDA AVVVAAQLSD RYISDRFLPD KAIDLIDEAG SRVRLRHSRI INNKEIKLQL 
KNISKDKAEA IRVQDFGKAS KLNQEELELQ AKIDLEDNLQ TVKAIVDEED IAQIVASWTG 
VPVNKLTESE SELLLHLEDT LHKRLIGQEQ AVAAVSRSIR RARVGLKNPK RPIASFIFSG 
PTGVGKTELA KALAAYFFGA GDSMIRLDMS EYMESHNVSK LIGSPPGYVG YDEGGQLTEA 
VRRKPYTVLL FDEIEKAHSD VFNMLLQILD EGHLTDAKGR KVDFKNTLII LTSNIGSKVI 
EKGGISLGFE FDNQADASYN GIRKLVNEEL KAYFRPEFLN RVDDIIVFTQ LNKEEVKQIA 
EIMLHDVANR LKDRGIKLEV TESFKELVVR EGYDPSYGAR PLRRAIMRLL EDSLAEAILS 
SHILEGDTAI VDVDDDGQVT VRKAETREFL LANVG