Gene Ava_3933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3933
Symbol
ID	3682978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	4887596
End bp	4888930
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	46%
IMG OID	637719285
Product	nitrogenase molybdenum-cofactor biosynthesis protein NifN
Protein accession	YP_324433
Protein GI	75910137
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01285] nitrogenase molybdenum-iron cofactor biosynthesis protein NifN

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0348274
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATCG TTACGCTCCC CAATAAATCA GTTGCGGTCA ATCCTCTCAA GCAAAGTCAA 
GCCCTGGGCG CTTCTTTAGC CTTCTTGGGA TTGAAAGGGA TGATTCCTCT GTTTCATGGT 
TCCCAAGGTT GTACAGCTTT TGCCAAAGTG GTGTTAGTCC GGCATTTTCG GGAAGCCATA 
CCCCTGGCGA CAACGGCGAT GACGGAAGTA ACTACCATTT TGGGTGGTGA AGATAATATT 
GAGCAAGCAA TTCTCACTTT GGTGGAGAAG TCCAGCCCAG AAATTATTGG TCTGTGTAGC 
ACTGGATTAA CAGAAACCAG AGGCGATGAT ATTGAACGCT TTCTTAAGGA TATCCGCGAT 
CGCCATCCGG AAATATCTCA CCTACCAATT GTATTCGCGC CTACACCAGA TTTTAAAGGG 
GCGTTGCAAG ATGGATTTGC GGCGGCTGTG GAAAGCATCG TCCAAGAAAT TCCCCAACCC 
GGTACAACCA GAAGCGAACA AGTCACAATT TTGGCTGGTT CTGCCTTCAC CCCCGGAGAT 
TTGCAAGAAA TCAAAGAGAT TGTCACCGCT TTTGGTTTAG TACCTATCTT TGTTCCTGAT 
ATTGGTGCTT CCTTGGATGG ACACTTAGAT GAGGAATATA GTTCGGTAAC AACCAGTGGA 
ACAACCGTCA CACAACTAAA AGAAGTCGGT CGTTCCGCCT TCACCATCGC CTTGGGTGAA 
AGTATGCGGG GTGCGGCGAG GATTTTGGAA GACAGATTTA ACATTCCCTA CGAAGTCTTT 
AGCGAACTCA CTGGCTTAGA ACCCGTAGAC GAATTTATCC AAGCCTTAGC AATTCTCAGC 
AGCAACCCAG TACCAGAAAA GTATTGTCGT CAACGTCGCC AACTACAAGA TGCAATGTTA 
GACACACACT TTTACTTTGG TGCAAAACGC ATCTCCTTGG CGCTAGAACC AGACCTGCTG 
TGGTCAATGG TCAAGTTTCT GCAATCAATG GGGACACAAA TTCACGCCGC CGTTACTACC 
ACACGCTCAC CCTTATTAGA ACAACTCCCC ATCAAGAGCG TAACCATCGG TGATTTAGAA 
GACTTTGAAG AACTGGCAGT AGAATCTGAC TTGCTAATTG GTAATTCTAA CTTAGCAGCG 
ATCGCCAAAC GTCTTTCCAT CCCTCACTAT CGTCTTGGTA TTCCCATTTA TGACCGCTTA 
GGTAATGGTC ATTTCACGAA AGTCGGCTAT CGCGGCTCAA TGGAAGTCTT GTTTGGCATC 
GGTAACCTAT TTATAGATGC AGAAGAAGCA AGAGTTAAGA ACTTTGATGA GAATTTTGTC 
ATGGGTAATA GGTAA

Protein sequence

MAIVTLPNKS VAVNPLKQSQ ALGASLAFLG LKGMIPLFHG SQGCTAFAKV VLVRHFREAI 
PLATTAMTEV TTILGGEDNI EQAILTLVEK SSPEIIGLCS TGLTETRGDD IERFLKDIRD 
RHPEISHLPI VFAPTPDFKG ALQDGFAAAV ESIVQEIPQP GTTRSEQVTI LAGSAFTPGD 
LQEIKEIVTA FGLVPIFVPD IGASLDGHLD EEYSSVTTSG TTVTQLKEVG RSAFTIALGE 
SMRGAARILE DRFNIPYEVF SELTGLEPVD EFIQALAILS SNPVPEKYCR QRRQLQDAML 
DTHFYFGAKR ISLALEPDLL WSMVKFLQSM GTQIHAAVTT TRSPLLEQLP IKSVTIGDLE 
DFEELAVESD LLIGNSNLAA IAKRLSIPHY RLGIPIYDRL GNGHFTKVGY RGSMEVLFGI 
GNLFIDAEEA RVKNFDENFV MGNR