Gene Aazo_3553 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3553
Symbol
ID	9341359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3622436
End bp	3623665
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	45%
IMG OID
Product	aluminum resistance family protein
Protein accession	YP_003722273
Protein GI	298492096
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.916774
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGCA TAGAGCAGCT GCAAGAAGCA GAACAGGCGC TATTAGAGAT TTTTTCTGGA 
ATTGACGCAC AGGTCAAGCA TAATCTTCAA AGAGTGCTAA CAGCATTTCG TAATCATCGA 
GTAGGGGCGC ACCACTTTGC GAGTGTAAGC GGTTATGGAC ATGATGATTT AGGGAGAGAA 
ACCTTAGATC AAGTTTTTGC CCAAGTAATG GGAGCAGAAG CTGCGTTGGT GCGAGTGCAG 
ATTGTATCAG GAACTCATGC GATCACCTGT GCGCTTTATG GAGTGCTTCG GCCTGGGGAT 
GAAATGTTAG CAGTGATTGG TTCTCCCTAC GATACTTTGG AAGAGGTAAT TGGCTTGCGT 
GGTCAAGGCC AAGGGTCTCT TATTGATTTT GGCATAAAAT ACCGCCAACT AGAACTAAAC 
GAAGAAGGAA AAATAGATTG GCAAGCATTA CAGCACGGAA TTCAAGAAAA TACCAAATTA 
GTATTAATTC AACGTTCCTG TGGATATTTA TGGAGGCCAA GCCTCTCTAT ACAAGAGATT 
GAAAAAATCA TTCACATAGT CAAACAGCAA AACCCCAACA CTGTATGTTT CGTAGATAAC 
TGTTATGGCG AATTTATTGA TATTAAAGAA CCTACTCATG TAGGTGCTGA CTTAATGGCC 
GGGTCATTAA TTAAAAATCC TGGCGGTACA TTAGTTACAG CAGGGGGATA TATAGCAGGA 
AGAGCAGACC TAGTAGAAGC TGCAGCTTGT AGACTAACAG CCCCCGGAAT AGGTAGTGCT 
GGAGGAGCGA CCTTCGACCA AAACCGCCTC TTATTCCAGG GATTATTTTT AGCACCGCAG 
ATGGTTGGGG AAGCTATGAA AGGAACATAC CTAACAGGAT ACGTATTTGA CAAACTTGGA 
TATCCAGTTA ACCCCCCACC CTTAGCACCA CGAGGAGATG TCATCCAAGC GATTAAACTG 
GGTTCAGCCA AAAAGCTGAT CGCCTTTTGT AAAGCCATCC AACAGTCTTC ACCCATCGGG 
TCTTATCTCG ACCCTATACC CGACGATATG CCAGGCTATG AAAGCGAAGT AGTCATGGCT 
GGAGGCACAT TTATTGAAGG CAGCACCTTG GAATTATCAG CTGATGGCCC ATTACGTGAG 
CCTTATGTTG TGTATTGTCA AGGGGGTACA CATTGGACTC ATGTAGCAAT CGCTTTACAG 
GCAGCTATTG AGGCTGTAGG AGAAGCTTAG

Protein sequence

MNSIEQLQEA EQALLEIFSG IDAQVKHNLQ RVLTAFRNHR VGAHHFASVS GYGHDDLGRE 
TLDQVFAQVM GAEAALVRVQ IVSGTHAITC ALYGVLRPGD EMLAVIGSPY DTLEEVIGLR 
GQGQGSLIDF GIKYRQLELN EEGKIDWQAL QHGIQENTKL VLIQRSCGYL WRPSLSIQEI 
EKIIHIVKQQ NPNTVCFVDN CYGEFIDIKE PTHVGADLMA GSLIKNPGGT LVTAGGYIAG 
RADLVEAAAC RLTAPGIGSA GGATFDQNRL LFQGLFLAPQ MVGEAMKGTY LTGYVFDKLG 
YPVNPPPLAP RGDVIQAIKL GSAKKLIAFC KAIQQSSPIG SYLDPIPDDM PGYESEVVMA 
GGTFIEGSTL ELSADGPLRE PYVVYCQGGT HWTHVAIALQ AAIEAVGEA