Gene Aazo_1349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1349
Symbol
ID	9339144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1419823
End bp	1421154
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	40%
IMG OID
Product	nitrogenase molybdenum-iron cofactor biosynthesis protein NifN
Protein accession	YP_003720728
Protein GI	298490551
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.786578
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAATTG TCACTGTTCC CAATAAGTCT GTTAGTGTTA ATCCTCTCAA ACAAAGTCAA 
GCTTTAGGTG CATCTTTGGC TTTTTTGGGT TTGAAGGGAA CTATGCCTTT ATTTCATGGT 
TCTCAAGGTT GTACTGCTTT TGCTAAGGTG GTTTTGGTTC GACATTTTCG GGAAGCAATT 
CCTCTTGCTA CTACAGCAAT GACGGAAGTT ACCACTATTT TGGGTGGTGA GGAAAATGTT 
GAACAAGCTA TTCTCACTTT GGTGGAAAAA GCTAAACCGG AAATTATCGG CTTGTGTACG 
ACTGGATTAA CAGAAACTAG AGGAGATGAT ATTGAACGTT TCTTGAAGGA TATTCGGGAA 
CGTCATCCAG AACTTGACTA TTTAGCAATT GTTTTTGCTC CGACTCCTGA TTTTAAAGGT 
GCGTTGCAAG ATGGTTTTGC GGTAGCTGTA GAAACTATTC TGAAGGAAGT TCCTAAAGCT 
GGAGGAGTTA AACCTGAACA AATTACGATT TTAGCAGGTT CGGCTTTTAC TCCTGGGGAT 
GTGCAGGAAG TTCGAGAGAT GGTGACATCT TTTGGACTAG AAGCGATCTT TGTCCCTGAT 
TTGGGTGCTT CGTTGGATGG TCATTTGGAA GATGACTACA GCGCAGTAAC TGTTAGTGGT 
ACGACTCTTA AACAACTCCG TTCTTTGGGT AGTTCTGCTT TCACTTTCGC CTTAGGTGAA 
AGTATGCGTG GTGCTGCAAA AATTCTCCAA GAACGTTTTA ATACAGATTA CGAAGTTTTT 
CGGGATTTGA CTGGTTTAGA ACCTGTGGAT GAGTTTTTAC AGGCTTTATC AGTTCTGAGT 
GGTAATCCTG TACCGGAAAA ATATTGTCGT CAACGTCGTC AGCTGCAAGA TGCGATGTTG 
GATACTCATT TTTACTTCGG TGCTAAACGG GTTTCTTTGG CTTTAGAACC GGATTTAATG 
TGGACTACAG TGCAGTTTCT ACAGTCAATG GGGGCTTCTA TTCATGCTGC TGTGACAACG 
ACGCGATCAC CTTTGTTAGA ACATCTTCCT ATAAAAAATG TTACTATTGG TGATTTGGAA 
GATTTGGAAG ATTTAGCAGT GGGTTCTGAT TTATTGATTG GTAATTCTAA TGTGAACACC 
ATATCGAAAC GCCTCAAAAT TCCCCACTAT CGTTTAGGAA TTCCCATCTA TGACCGCTTA 
GGAAATGGTC TATTTACCAA AGTAGGCTAT CGCGGAACTA TGGAACTTTT ATTTGCTATA 
GGAAACCTGT TTTTAGAACA TGAAGAGTCA TTAATGATGA ATCATTGGTC ACCAGTAATT 
AATAGGGATT AG

Protein sequence

MAIVTVPNKS VSVNPLKQSQ ALGASLAFLG LKGTMPLFHG SQGCTAFAKV VLVRHFREAI 
PLATTAMTEV TTILGGEENV EQAILTLVEK AKPEIIGLCT TGLTETRGDD IERFLKDIRE 
RHPELDYLAI VFAPTPDFKG ALQDGFAVAV ETILKEVPKA GGVKPEQITI LAGSAFTPGD 
VQEVREMVTS FGLEAIFVPD LGASLDGHLE DDYSAVTVSG TTLKQLRSLG SSAFTFALGE 
SMRGAAKILQ ERFNTDYEVF RDLTGLEPVD EFLQALSVLS GNPVPEKYCR QRRQLQDAML 
DTHFYFGAKR VSLALEPDLM WTTVQFLQSM GASIHAAVTT TRSPLLEHLP IKNVTIGDLE 
DLEDLAVGSD LLIGNSNVNT ISKRLKIPHY RLGIPIYDRL GNGLFTKVGY RGTMELLFAI 
GNLFLEHEES LMMNHWSPVI NRD