Gene Aazo_1090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1090
Symbol
ID	9338886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	1170741
End bp	1171886
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	42%
IMG OID
Product	transaldolase
Protein accession	YP_003720565
Protein GI	298490388
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACCA ATCATTTATT AGAGATAAAA CAATACGGTC AAAGTATCTG GATGGATAAT 
TTGAGCCGTG AGATTATTGA ATCAGGGGAA CTCGAAAACT TGGTAAAAAA TCAAGGAATC 
TCTGGTATTA CCTCCAATCC TGCCATCTTT GAAAAAGCAA TTACTGGTAA TGCCATTTAT 
GATGCTGATA TTGAAGCCGG AATTCGTGAG GTTTTACCAA CATACAAAAT CTATGAATCA 
CTAATTTTCG CAGATATCCG CAATGCTTGT GATATTTTGC GCCCTGTTTA TGAAGCCACG 
AATGGTCTTG ATGGTTATGT GAGTATAGAA GTTCCACCAA CTATAGCTCA TGATACCCAA 
GCAACAATAG CTGAAGCTCG TCGCTATTTC CAAGAGATTG GGCGAGAAAA TGTGATGATT 
AAAATTCCTG GGACTGAGGC GGGTTTACCG GCAATAGAAC AAGCAATATT CGAAGGAATT 
AACATCAACG TGACGCTGTT ATTTGCTGTC CAAAGTTACA TTAATACAGC TTGGGCGTAT 
ATTCGTGGGT TGGAAAAGAG AGTGACTCAA GGTAGGGATA TCAGCAAAAT TGCTTCTGTA 
GCCAGCTTTT TTCTCAGCCG GATTGATAGC AATATCGACG GTAAGATAGA TGCTAAATTG 
CAGCGAGGCG TTGATGACAT TAATCATGAA GCGGTGCTGC GAGGGGTAAG AGGGAAAGTT 
GCGATCGCCA ACGCCAAGAT AGCTTACCAA GAATACAAAA AAATCACCAG CACCGATGCC 
TGGCAAGCCC TATCAACAAA AGGTGCAAAA GTCCAGCGGT TACTGTGGGC CAGCACCAGC 
ACCAAAGACC CCAGTTACAG TGATGTCATG TACGTCGATC AACTAATTGG CAAAGACACA 
GTGAACACCT TACCACCAGC TACTATAAAG GCTTGTGCTG ATCATTGTAA TGTAAGCGAT 
TACCTGGAGA CAGGCACTTT AGAAGCTTAC ACCCTCATAG AAAGCTTGAA AGAACCGGAC 
ATCAACATTG ATATTAATAC GGTAATGGAC GAACTACTCG CCGAAGGTAT TGATAAGTTT 
GTCCAGCCCT TCCAGTCACT CATGAACTCT TTAGAAGGCA AAGTCAAGCT ATTGTCACCA 
GTATAG

Protein sequence

MATNHLLEIK QYGQSIWMDN LSREIIESGE LENLVKNQGI SGITSNPAIF EKAITGNAIY 
DADIEAGIRE VLPTYKIYES LIFADIRNAC DILRPVYEAT NGLDGYVSIE VPPTIAHDTQ 
ATIAEARRYF QEIGRENVMI KIPGTEAGLP AIEQAIFEGI NINVTLLFAV QSYINTAWAY 
IRGLEKRVTQ GRDISKIASV ASFFLSRIDS NIDGKIDAKL QRGVDDINHE AVLRGVRGKV 
AIANAKIAYQ EYKKITSTDA WQALSTKGAK VQRLLWASTS TKDPSYSDVM YVDQLIGKDT 
VNTLPPATIK ACADHCNVSD YLETGTLEAY TLIESLKEPD INIDINTVMD ELLAEGIDKF 
VQPFQSLMNS LEGKVKLLSP V