Gene PCC8801_1788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1788
Symbol
ID	7101850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1875290
End bp	1876702
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	45%
IMG OID	643474856
Product	nitrogenase MoFe cofactor biosynthesis protein NifE
Protein accession	YP_002371990
Protein GI	218246619
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01283] nitrogenase molybdenum-iron cofactor biosynthesis protein NifE

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAA CTAAAGGCAA AATCAACGAA TTACTAACAC AACCAGGCTG CGAACATAAT 
CATAATAAGG AAGGACAAGG GAAAAACAAA TCTTGTACCC AACAGGCTCA ACCTGGCTCA 
GCACAAGGGG GATGCGCTTT TGATGGGGCT TCTATTGCTC TGGTTCCGAT TACCGATGCT 
GCCCATTTAG TCCACGGTTC AATCGCCTGT TCTGGTAATA GTTGGAACAG TCGGGGCAGT 
CTGAGCAGTG GTCCGATGAC TTATAAAATG GGTTTTACAA CAGATTTATC AGAAAATGAT 
GTTATTTTTG GTGGTGAAAA AAAGCTTTAT CAAGCGATCG CTCAATTAGT AAAACGCTAC 
CATCCGGCGG CGGTTTTTGT CTATTCGACC TGTGTTACCG CGTTAATTGG AGATGATCTT 
GATGCGGTGT GTAAAGCAGC CACAAAAAAA TATGAAACGC CGATTATTCC CGTTCATGCC 
CCTGGATTTG TTGGTAGTAA AAACCTAGGA AACCGTCTCG GTGGTGAAGC ACTTCTTGAT 
CATGTTGTGG GAACCCGTGA GCCAGAATTT ACCACGGATT TTGATATTAA TTTGATTGGA 
GAATACAACG TCGCTGGAGA AATGTGGGGC GTTTTACCTC TGTTTGAAAA GTTAGGTATT 
CGGGTGTTAG CTAAGATTAC GGGAGATGCC CGTTACGAAG AAGTTTGTTA TGCCCATCGT 
GCTAAACTTA ATTTAATGAT CTGCTCTAAG GCTCTGATTA ACATGGCCAC AGCAATGCAA 
GAGCGTTATG GTATTCCCTA CATTGAAGAG TCTTTCTATG GCATTGCAGA CATGAACCGT 
TGTTTACGGA ACATCGCTGA GTATTTCGGA GATGCCGCTT TAAAAGAACG GGTAGAACAG 
TTAATAGAAG AAGAAACCAC GAAATTAGAC CTAGCCTTAG CCCCCTACCG GGAACGTCTC 
AAGGGTAAGC GCGTTGTCCT CTACACGGGA GGGGTCAAGA GTTGGTCGGT GGTGTCCGCA 
GCGCAAGATT TAGGCATGGA AGTGGTGGCC ACCAGCACCA AGAAGAGTAC GGAAGAAGAT 
AAAGCGAAGA TTCGAGAATT ATTAGGCAAA GATGGAATTA TGCTCGAAAA AGGCAGCCCG 
ACGGAATTAT TGCGGGTTGT GGAGCAAACC AAGGCAGATT TATTAGTCGC AGGGGGTCGT 
AATCAGTATA CCGCCCTCAA GGCTAGGATT CCTTTTTTGG ATATTAACCA AGAACGTCAC 
CATCCCTACG CGGGATATGT TGGGATGATT GAGATGGCGC GAGAATTGGA CGAAGCCGTT 
CATAGTCCTA TCTGGCGGTT AGTTCGTCAA CCTTCCCCTT GGGATATTTG GCAACAGGAA 
CACGAAAGTT TATTGAATTT AGAAGCGGAA TAA

Protein sequence

MKLTKGKINE LLTQPGCEHN HNKEGQGKNK SCTQQAQPGS AQGGCAFDGA SIALVPITDA 
AHLVHGSIAC SGNSWNSRGS LSSGPMTYKM GFTTDLSEND VIFGGEKKLY QAIAQLVKRY 
HPAAVFVYST CVTALIGDDL DAVCKAATKK YETPIIPVHA PGFVGSKNLG NRLGGEALLD 
HVVGTREPEF TTDFDINLIG EYNVAGEMWG VLPLFEKLGI RVLAKITGDA RYEEVCYAHR 
AKLNLMICSK ALINMATAMQ ERYGIPYIEE SFYGIADMNR CLRNIAEYFG DAALKERVEQ 
LIEEETTKLD LALAPYRERL KGKRVVLYTG GVKSWSVVSA AQDLGMEVVA TSTKKSTEED 
KAKIRELLGK DGIMLEKGSP TELLRVVEQT KADLLVAGGR NQYTALKARI PFLDINQERH 
HPYAGYVGMI EMARELDEAV HSPIWRLVRQ PSPWDIWQQE HESLLNLEAE