Gene Aazo_3338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3338
Symbol
ID	9341142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	3407487
End bp	3409007
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	46%
IMG OID
Product	ATP synthase F1 subunit alpha
Protein accession	YP_003722129
Protein GI	298491952
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTATTT CCATTAGACC TGACGAAATC AGCAACATTA TCCAACAGCA AATCGAGCAA 
TACAACCAAG AGGTTAAAGT TGCTAACGTT GGTACTGTGC TACAAGTAGG TGACGGTATT 
GCCCGGATAT ATGGTCTAGA AAAGGCTATG GCTGGGGAAC TCCTAGAATT TGAAGATGGT 
ACTATTGGTA TCGCCCAAAA CTTAGAAGAA GATAACGTGG GCGCGGTACT GATGGGTGAA 
GGTAGAAACA TTCAAGAAGG TAGCTCCGTA ACTGCTACTG GTAGAATTGC TCAAGTAGGG 
GTAGGCGAAG TCCTCATTGG TCGTGTCCTT GATGCTTTGG GTCGCGCCAT TGATGGTAAA 
GGTGATCCTA AGACTACCGA AACTCGGTTA ATTGAATCCC CAGCACCTGG TATTATTGCC 
CGTCGGTCTG TACACGAACC TATGCAAACA GGTATCACCG CAATTGACTC CATGATTCCC 
ATCGGCCGTG GTCAACGGGA ATTAATCATT GGAGACCGTC AAACTGGTAA AACTGCGATT 
GCAATTGACA CCATCATCAA CCAAAAAGGT GAAGATGTAG TTTGCGTTTA CGTGGCGATC 
GGTCAAAAAG CTTCCACAGT TGCTAACGTA GTCCAAACCT TACAAGAAAA AGGCGCAATG 
GACTACACCG TAGTTGTAGC AGCTAACGCC AGTGACCCAG CAACCTTACA ATTCCTCGCA 
CCCTACACAG GCGCTACCAT TGCTGAATAC TTCATGTATA AAGGCAAAGC AACCTTAGTA 
ATTTACGATG ACCTTTCCAA GCAAGCACAG GCATATCGCC AAATGTCCTT GCTACTACGT 
CGTCCACCCG GACGGGAAGC GTATCCTGGA GACGTATTCT ACATTCACTC CCGCTTGTTG 
GAACGTGCTG CTAAACTCAG CGACGAACTA GGTAAAGGTA GTATGACTGC CCTACCTATC 
ATCGAAACCC AAGCTGGTGA CGTATCTGCA TACATTCCTA CCAACGTAAT TTCCATCACA 
GACGGTCAGA TTTTCTTGTC TTCCGACTTG TTTAACTCTG GTATCCGTCC CGCTGTAAAC 
CCTGGTATCT CCGTATCCCG TGTAGGTTCT GCGGCACAAA CCAAGGCAAT GAAAAAAGTT 
GCTGGTAAGA TTAAGTTAGA ATTGGCACAG TTTGATGACC TTCAAGCTTT CGCACAATTT 
GCTTCTGACT TAGATAAAGC CACCCAAGAC CAGTTAGCAC GTGGTGTCCG CTTACGGGAA 
CTCTTGAAGC AGCCCCAAAA CGACCCCCTC TCCGTAGCTG AACAAGTAGC AGTTCTTTAC 
GCTGGTATTA ACGGTTATTT GGATGACATT GCTGTAAATA AAGTAACCAG CTTTGCTCAA 
GGCCTACGCG ATTACTTGAA GACAGGAAAT ACAGCTTATT ACCAAGCAGT ACAAGATAGG 
AAAGTCCTTG GTGATCCAGA AGAAGCAGCA TTGAAAGCCG CTATCTCTGA GTTCAAAAAG 
ACCTTCCAAG CAGCAGCGTA A

Protein sequence

MSISIRPDEI SNIIQQQIEQ YNQEVKVANV GTVLQVGDGI ARIYGLEKAM AGELLEFEDG 
TIGIAQNLEE DNVGAVLMGE GRNIQEGSSV TATGRIAQVG VGEVLIGRVL DALGRAIDGK 
GDPKTTETRL IESPAPGIIA RRSVHEPMQT GITAIDSMIP IGRGQRELII GDRQTGKTAI 
AIDTIINQKG EDVVCVYVAI GQKASTVANV VQTLQEKGAM DYTVVVAANA SDPATLQFLA 
PYTGATIAEY FMYKGKATLV IYDDLSKQAQ AYRQMSLLLR RPPGREAYPG DVFYIHSRLL 
ERAAKLSDEL GKGSMTALPI IETQAGDVSA YIPTNVISIT DGQIFLSSDL FNSGIRPAVN 
PGISVSRVGS AAQTKAMKKV AGKIKLELAQ FDDLQAFAQF ASDLDKATQD QLARGVRLRE 
LLKQPQNDPL SVAEQVAVLY AGINGYLDDI AVNKVTSFAQ GLRDYLKTGN TAYYQAVQDR 
KVLGDPEEAA LKAAISEFKK TFQAAA