Gene PCC8801_1789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1789
Symbol
ID	7104994
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1876772
End bp	1878157
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	45%
IMG OID	643474857
Product	nitrogenase molybdenum-cofactor biosynthesis protein NifN
Protein accession	YP_002371991
Protein GI	218246620
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01285] nitrogenase molybdenum-iron cofactor biosynthesis protein NifN

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTATTG TTCTTAATCC GAAAAAACCG TTATCGGTGA ATCCATTAAA AATGAGTCAA 
CCTTTGGGGG CTTCCTTGGC CTTTTTGGGG TTAAAAGGGA TGATGCCCTT ATTTCATGGG 
GCTCAAGGCT GTACCGCCTT TGCTAAAGTG GTTCTGGTGC GTCATTTCCG CGAATCTATT 
CCCCTGTCTA CCACGGCGAT GACGGAGGTT AGTACCATTT TAGGGGGTCA AGATCACGTT 
GAACAGGCCA TTTTAACTAT CGTTGACAAG AACAAACCCG AAATCATCGG ACTGCTGACC 
ACTGGGTTAA CGGAAACCCG TGGGGATGAT ATGGAGGGTA TTCTTAAGGA TATCCGTCAA 
AAGCACCCAC AATTAAAGAA TTTACCGATT GTTTTTGTCT CTACGCCCGA TTATAAGGGG 
TCACTACAGG ATGGCTACGC AGCCACGGTA GAGCAAATCG TTGCGACCGA TTATAATGCC 
TTTATCGCCG AAAATGCCCG AAGTGCGGTC ATTTATCCCC AACCCCAGGT GACGGTTTTG 
GCGGGTTCTT CCCTATCTCC TGGGGATATC CAAGAAATTA AGTCCATTAT TGAAGCTTTT 
GGCTTAATGC CCCTGGTTAT TCCCGATTTA TCGAGATCTC TCGATGGTCA TCTAGAGGAT 
GGCTATCAGT CCATAACGGG AGGAGGAACG ACCCTGCCCC AGTTGCGATC GCTGCCCCAT 
TCCTGTTATA CCCTAGCTAT TGGGGAAAGT ATGCGCGGGG CAGCAGAAAT CTTAAAAGAC 
CGTTTTGGAA CGAATTATGA AGTATTCCCC CGTTTAGCAG GATTAGAGGC GGTAGATACT 
TTTTTATGGC GATTATCGCA GATTGTTACC TCTCGCTGCG ATCATCATTT CCCCATTGTT 
CCTAATATTC CGGCTTTATT TGAACGCCAA CGCCGCCAGT TACAAGATGC TATTCTTGAC 
ACCCATTTCT ATTTTGGGGG TAAAAAAGTT GCCCTCGCAT TAGAACCCGA TTTACTCCAT 
CAAACGGCTT GGTTATTGAC AGAAATGGGT GCAAAAATTC AGGCGGCTGT TACCACTACT 
AAGTCACCTT TATTGGAAGA TTTGCCTGTT GATACTGTGA CTATTGGCGA CTTAGAAGAT 
TTAGAAGATT TGTCCGCAGG GGTCGATTTA ATTATTACCA ATTCCCACGG CACAGCAATG 
GCACAACGGT TAAATGCGCC CTTGTATCGT ATGGGTTATC CGGTGTTTGA TCAGTTAGGA 
AATGGTCAAC GCTGTTTAGT TGGATATCGT GGAACAATAC AATTTTTGTT TGATGTTGGC 
AATATTTTAT TAGCCGAAGA AGCAAACCAC AATCATCAAT TATCGGTCGG GGTTCATGTT 
ACCTAA

Protein sequence

MTIVLNPKKP LSVNPLKMSQ PLGASLAFLG LKGMMPLFHG AQGCTAFAKV VLVRHFRESI 
PLSTTAMTEV STILGGQDHV EQAILTIVDK NKPEIIGLLT TGLTETRGDD MEGILKDIRQ 
KHPQLKNLPI VFVSTPDYKG SLQDGYAATV EQIVATDYNA FIAENARSAV IYPQPQVTVL 
AGSSLSPGDI QEIKSIIEAF GLMPLVIPDL SRSLDGHLED GYQSITGGGT TLPQLRSLPH 
SCYTLAIGES MRGAAEILKD RFGTNYEVFP RLAGLEAVDT FLWRLSQIVT SRCDHHFPIV 
PNIPALFERQ RRQLQDAILD THFYFGGKKV ALALEPDLLH QTAWLLTEMG AKIQAAVTTT 
KSPLLEDLPV DTVTIGDLED LEDLSAGVDL IITNSHGTAM AQRLNAPLYR MGYPVFDQLG 
NGQRCLVGYR GTIQFLFDVG NILLAEEANH NHQLSVGVHV T