Gene Aazo_1946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1946
Symbol
ID	9339739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	2026860
End bp	2028431
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	38%
IMG OID
Product	radical SAM domain-containing protein
Protein accession	YP_003721157
Protein GI	298490980
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGCTT TACTACTCTG GCCGATCATG CCTAATTCTT TCTGGTCTTA TCAGGAAACC 
CTTGCTTTGG CTGGGTTACG TGCGACAAAT CCCCCACTAG GTTTAATCAC AGTAGCAGCG 
ATGTTACCGA GTGATTGGGA AATTAGATTG TCCGATCGCA ATGTCCGTCT AGAAACAGAT 
GCAGATTGGG AATGGTGCAA TATTGTCATC CTCTCTGCAA TGATTATCCA AAAACAAGAT 
TTTGGTGAAT TAATTCAAAA AGGTAAAAGG TTAGGTAAAA AAGTCGCAGT CGGTGGACCT 
TTTGCTACAT CTGTACCAGA ATTTGTCTTA GAAGCAGGAG CAGATTATTT AATTTTAGAT 
GAAGGAGAAA TCACCATCCC GATGTTTTTA GAGGCTTTAG AAAAGGGAGA AGAAAAAGGT 
ATTTTCCGAG CTACAGAAAA ACCAGATGTT ACCCAAACTC CCTTACCTAG ATTTGATTTA 
TTAGACCTAA ATGCTTACAT AGCTATGACC GTACAGTTTT CACGGGGTTG TCCATTTCAA 
TGTGAGTTCT GTGATATTAT CACCCTTTTT GGACGCAAAC CCCGCACGAA AACACCAGAA 
CAGATCTTAG TAGAATTGGA AGTATTATAT CAGATGGGTT GGTGGCGTTA TGTATTTATT 
GTTGATGATA ACTTTATCGG CAATAAACGT AATGCTAAAA TCTTTTTAAG GGAACTAATT 
CCCTGGATGG AAAAACGAAA TTATCCTTTT GCTTTACTCA CCGAGGCTTC TTTGAATTTA 
GCAGAAGATG ATGAATTATT AGAATTAATG GTAAAAGCTG GTTTTGTTCA GGTATTCATG 
GGTATTGAAA CTCCTGATGT AGAAAGTTTA GTAGGAGCAA ATAAAGAACA AAATACCCGT 
AAGTCTTTAG TGGAGTCCTG CCACAAAATT ACCAAAGCCG GACTACAAAT TATGTCTGGT 
TTTATCTTAG GATTCGATCA TGAAAAACCT GGTGCAGGTA AACGTATTCA AGAGTTTGTG 
GAAGAAACTA ATATTCCCCA AGCCCATCTT AATTTATTGC AAGCATTACC AAATACAGCC 
ATGTGGAATC GGCTGCAAAA AGAAGGAAGG TTAATAGATG CGTTAGGTGA ATTTCTAGGT 
TCTCAAAAAT CTTTAATTAA CTTTGTTCCT ACTCGTCCCA TGACAGAAAT AGCTGACGAG 
TTTATCGAAA CTTTTTGGAA TTTGTATGAA CCCATACCTT ACCTCAAACG TACTTTTCGT 
CATTTTATGA TGATGGAGGG TTGGCGGGCT AAATATCAAC GGACCTTAAC AAAAGCAGAG 
TGGGACTTTT TAGGGGCTAT TTGTTGGAGA CAGGGAATAT TGCGTTCTAC AAGATTTCAT 
TTTTGGTGGC AATTAATAGT TATGGCATGG CATAAACCAA ATTTATTATA TGACTATTTA 
ATCGCCTTGG GTGTGGGTGA ACATTTTTTC AGTTTTCGTC ATGAGGTAAA AGTAGAAATA 
GAATCAGAAT TAGCATTATT ACAGCAGCAA GAATTCGATA AAAAATCAGC AACGTTAAGT 
TATAAACCGT GA

Protein sequence

MRALLLWPIM PNSFWSYQET LALAGLRATN PPLGLITVAA MLPSDWEIRL SDRNVRLETD 
ADWEWCNIVI LSAMIIQKQD FGELIQKGKR LGKKVAVGGP FATSVPEFVL EAGADYLILD 
EGEITIPMFL EALEKGEEKG IFRATEKPDV TQTPLPRFDL LDLNAYIAMT VQFSRGCPFQ 
CEFCDIITLF GRKPRTKTPE QILVELEVLY QMGWWRYVFI VDDNFIGNKR NAKIFLRELI 
PWMEKRNYPF ALLTEASLNL AEDDELLELM VKAGFVQVFM GIETPDVESL VGANKEQNTR 
KSLVESCHKI TKAGLQIMSG FILGFDHEKP GAGKRIQEFV EETNIPQAHL NLLQALPNTA 
MWNRLQKEGR LIDALGEFLG SQKSLINFVP TRPMTEIADE FIETFWNLYE PIPYLKRTFR 
HFMMMEGWRA KYQRTLTKAE WDFLGAICWR QGILRSTRFH FWWQLIVMAW HKPNLLYDYL 
IALGVGEHFF SFRHEVKVEI ESELALLQQQ EFDKKSATLS YKP