Gene Aazo_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2041
Symbol
ID	9339834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	2119848
End bp	2121437
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	43%
IMG OID
Product	radical SAM domain-containing protein
Protein accession	YP_003721221
Protein GI	298491044
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTAT TACTTATATA TCCGTTGTTT CCAAAAAGTT TTTGGTCTTT TGAAAAAACA 
CTAGCTTTGC TAGACAGGAA AGCGATGTTA CCACCATTGG GCTTGGTGAC AGTAGCCGCA 
ATTTTACCCC AACAATGGAA TTTTAAGCTA GTAGACAGGA ATATTCGCCA AATTACCGAA 
GCAGAATGGG CTTGGGCTGA TTTGGTGATT TTATCAGCGA TGATTGTCCA AAAAGAGGAT 
TTACTCGCAC AGATTCAGGA AGCAAAGCGT CGTGGTAAGC TTGTGGCTGT GGGTGGACCA 
TACCCGACAG CATTACCTAA CGAAGTCACA GATGTGGGAG CAGATTATTT GATTTTGGAT 
GAAGGGGAAA TTACGCTACC TTTATTTATA GATGCGATCG GACGCGGTGA ATCTTCAGGA 
ATCTTTCGTT CTGGTGGTGA AAAACCAGAT GTGACAAACA CTCCCATTCC TCGTTTTGAC 
CTACTGGAAT TTGATGCCTA TGCGGAAATG TCAGTGCAAT TTTCCCGTGG CTGTCCCTTC 
CAGTGTGAGT TCTGCGACAT TATCGTCCTC TACGGTCGCA AACCCCGCAC CAAAACACCA 
GCCCAACTCC TCGCAGAACT TGATTATCTC TATGAATTAG GTTGGCGACG CAGTATTTTT 
ATGGTGGATG ATAACTTCAT CGGCAATAAG CGTAACGTTA AATTATTCTT GAAAGAACTA 
CAACCTTGGA TGGTTGCACA TCATTATCCC TTCTCCTTTG CCACAGAGGC TTCCGTTGAC 
TTAGCCCAAG ATCAAGAATT GATGGATGCA ATGGTAAGGT GTAATTTCGG GGCTGTGTTC 
TTGGGAATTG AAACCCCCGA CGAAGAAAGC CTTACTTTTA CTCAAAAATT CCAAAATACT 
CGAGATTCCC TCACCGAAGG AGTAAATAAA ATTACACGCT CAGGGTTACG AGTCATGGCA 
GGTTTTATTA TTGGCTTTGA TGGCGAAAAG TCGGGTGCTG GGGCGAGAAT TGTTAAATTT 
GTGGAACAGA CAGCCATTCC CACCGCTTTA TTTAGTATGC TCCAGGCCCT GCCTGATACA 
GCATTGTGGC ATAGATTAGA AAAGGAAAAC CGACTCCGCA ATAAATCTGC TAATATTAAT 
CAAACCACAT TGATGAATTT TTTTCCTACA AGACCTTTAG CAGAAATAGC CAGCGAATAT 
GTAGAAGCGT TTTGGGAACT ATACGAACCA TCAAGATTTT TAGATCGTGC TTATCGGCAC 
TACCGCATTT TGGGTCAAGC AACCTATCCC AAAAAGGGCA AAGGTGCTAA AAAACCATTG 
AATTGGAAGG TACTGCGGGC ATTGTTGACT ATTTGCTGGC AACAAGGTGT GTTCCGTAAT 
ACTCGTTGGC AATTCTGGCG CAATCTCTGG AGTATGTACA AGCATAATCC TGGTGGTATC 
AGTAGTTATT TAGCCGTTTG CGCTCAAATT GAGCATTTCT TGGAATATCG TCAGATTGTG 
CGGGATCAAA TTGAGGTTCA AATGGCTGAG TTTTTGGCAG CAGAAGCTCA AGTTAAGCTT 
GAGGAAGAAA AAGCTCAAGT TTTAGTTTAG

Protein sequence

MNVLLIYPLF PKSFWSFEKT LALLDRKAML PPLGLVTVAA ILPQQWNFKL VDRNIRQITE 
AEWAWADLVI LSAMIVQKED LLAQIQEAKR RGKLVAVGGP YPTALPNEVT DVGADYLILD 
EGEITLPLFI DAIGRGESSG IFRSGGEKPD VTNTPIPRFD LLEFDAYAEM SVQFSRGCPF 
QCEFCDIIVL YGRKPRTKTP AQLLAELDYL YELGWRRSIF MVDDNFIGNK RNVKLFLKEL 
QPWMVAHHYP FSFATEASVD LAQDQELMDA MVRCNFGAVF LGIETPDEES LTFTQKFQNT 
RDSLTEGVNK ITRSGLRVMA GFIIGFDGEK SGAGARIVKF VEQTAIPTAL FSMLQALPDT 
ALWHRLEKEN RLRNKSANIN QTTLMNFFPT RPLAEIASEY VEAFWELYEP SRFLDRAYRH 
YRILGQATYP KKGKGAKKPL NWKVLRALLT ICWQQGVFRN TRWQFWRNLW SMYKHNPGGI 
SSYLAVCAQI EHFLEYRQIV RDQIEVQMAE FLAAEAQVKL EEEKAQVLV