Gene Aazo_2084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2084
Symbol
ID	9339878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	2169752
End bp	2170939
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	40%
IMG OID
Product	arsenite-activated ATPase ArsA
Protein accession	YP_003721252
Protein GI	298491075
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0397137
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAGTAA TTTTAATGAC AGGTAAGGGT GGCGTAGGTA AAACCTCTGT TGCCGCAGCC 
ACTGGACTTC GGTCTGCAGA ACTCGGCTAT CGGACATTGG TTTTAAGTAC AGATCCTGCT 
CACTCCTTAG CAGATAGTTT TGATATAGAA TTGGGACATG ATGCCAAACA AGTGCGCCCA 
AATTTGTGGG GTGCAGAACT CGATGCACTG CAAGAATTAG AAGGTAACTG GGGTGCTGTA 
AAGCGTTATA TTACCCAAGT CTTACAGGCA CGGGGTTTAG ACGGGATACA AGCGGAAGAA 
TTGGCAATTT TACCAGGCAT GGATGAGATT TTCGGCTTGG TCAGAATGAA ACGTCACTAT 
GATGAAGGGG AATTTGACGT TTTGATTATT GATTCTGCCC CAACTGGTAC TGCACTGCGT 
TTGCTAAGTT TACCAGAAGT TGGTGGCTGG TATATGCGGC GTTTTTACAA ACCTTTTCAA 
AATATCTCAG TGGCACTCAG ACCTTTAGTA GAACCGCTGT TTAGACCCAT TGCTGGTTTT 
TCTTTACCAG ATAAAGAAGT AATGGATGCG CCTTATGAGT TTTATGAACA AATAGAAGCA 
CTGGAAAAAG TATTGACTGA CAATAATCAA ACATCGGTTC GACTTGTCAC GAACCCAGAA 
AAAATGGTGA TTAAAGAATC TCTTCGGGCT CATGCTTATC TGAGCTTGTA TAATGTAGCG 
ACAGATTTAG TCGTAGCTAA TCGCATTATT CCTAAAGAAG TTGAAGATCC CTTTTTCCAA 
CGTTGGAAAG AAAATCAAGA GCAATATCGC CAAGAAATTC ATGAAAACTT TCACCCCTTA 
CCTGTGAAAG AAATTCCTCT TTATTCTGAG GAAATGTGTG GTTTAGCAGC ATTAGATAGA 
CTGAAAGAAA CTCTCTACTC AGATGAAGAC CCAACTCAGA TTTATTACAA AGAAACTACT 
ATGAGAATTG TGACGGAAAA TAACCAATAC AGCTTGGAAC TTTATTTACC TAATATTCCT 
AAAAGCCAGA TTCAACTCAG TAAAACTGGT GACGAATTAA ACATTACTAT TGGTAATCAT 
CGCCGTAACT TGATTTTACC CCAAGCTTTA GCCGCACTGC AACCATCAGG GGCAAAAATG 
GATGATGATT ATCTAAAAAT TCGTTTTGCT GACAATGTAA GAGTCTAG

Protein sequence

MRVILMTGKG GVGKTSVAAA TGLRSAELGY RTLVLSTDPA HSLADSFDIE LGHDAKQVRP 
NLWGAELDAL QELEGNWGAV KRYITQVLQA RGLDGIQAEE LAILPGMDEI FGLVRMKRHY 
DEGEFDVLII DSAPTGTALR LLSLPEVGGW YMRRFYKPFQ NISVALRPLV EPLFRPIAGF 
SLPDKEVMDA PYEFYEQIEA LEKVLTDNNQ TSVRLVTNPE KMVIKESLRA HAYLSLYNVA 
TDLVVANRII PKEVEDPFFQ RWKENQEQYR QEIHENFHPL PVKEIPLYSE EMCGLAALDR 
LKETLYSDED PTQIYYKETT MRIVTENNQY SLELYLPNIP KSQIQLSKTG DELNITIGNH 
RRNLILPQAL AALQPSGAKM DDDYLKIRFA DNVRV