Gene Cyan8802_1816 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_1816
Symbol
ID	8391130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	1849921
End bp	1851333
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	45%
IMG OID	644979803
Product	nitrogenase MoFe cofactor biosynthesis protein NifE
Protein accession	YP_003137550
Protein GI	257059662
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01283] nitrogenase molybdenum-iron cofactor biosynthesis protein NifE

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.615494
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAA CTAAAGGCAA AATCAACGAA CTGCTAACAC AACCAGGCTG CGAACATAAT 
CATAATAAGG AAGGACAAGG GAAAAACAAA TCTTGTACTC AACAGGCTCA ACCTGGCTCA 
GCACAAGGGG GATGCGCTTT TGATGGGGCT TCTATTGCTC TGGTTCCGAT TACCGATGCT 
GCCCATTTAG TCCACGGTTC TATCGCCTGT TCTGGTAATA GTTGGAACAG TCGAGGCAGT 
CTGAGCAGTG GTCCGATGAC TTATAAAATG GGTTTTACAA CAGATTTATC AGAAAATGAT 
GTTATTTTTG GTGGTGAAAA AAAGCTTTAT CAAGCGATCG CTCAATTAGT AAAACGCTAC 
CATCCGGCGG CGGTTTTTGT CTATTCGACC TGTGTTACCG CGTTAATTGG AGATGATCTT 
GATGCGGTGT GTAAAGCAGC CACAAAAAAA TATGAAACGC CGATTATTCC CGTTCATGCC 
CCTGGATTTG TTGGTAGTAA AAACCTAGGA AACCGTCTCG GTGGTGAAGC ACTTCTTGAT 
CATGTTGTGG GAACCCGTGA GCCAGAATTT ACCACGGATT TTGATATTAA TTTGATTGGA 
GAATACAACG TCGCTGGAGA AATGTGGGGC GTTTTACCTC TATTTGAAAA GTTAGGTATT 
CGGGTGTTAG CTAAGATTAC GGGAGATGCC CGTTACGAAG AAGTTTGTTA TGCCCATCGT 
GCTAAACTTA ATTTAATGAT CTGCTCTAAG GCTCTGATTA ACATGGCCAC AGCAATGCAA 
GAGCGTTATG GTATTCCCTA CATTGAAGAG TCTTTCTATG GCATTGCAGA CATGAACCGT 
TGTTTACGGA ACATCGCTGA GTATTTCGGA GATGCCGCTT TAAAAGAACG GGTAGAACAG 
TTAATAGAAG AAGAAACCAC GAAATTAGAC CTAGCCTTAG CCCCCTACCG GGAACGTCTC 
AAGGGTAAGC GCGTTGTCCT CTACACCGGA GGGGTTAAGA GTTGGTCGGT GGTGTCCGCA 
GCGCAAGATT TAGGCATGGA AGTGGTGGCC ACCAGCACCA AGAAGAGTAC GGAAGAAGAT 
AAAGCGAAGA TTCGAGAATT ATTAGGCAAA GATGGAATTA TGCTCGAAAA AGGCAGCCCG 
ACGGAATTAT TGCGGGTTGT GGAGCAAACC AAGGCAGATT TATTAGTCGC AGGGGGTCGT 
AATCAGTATA CCGCCCTTAA GGCTAGGATT CCTTTTTTGG ATATTAACCA AGAACGTCAC 
CATCCCTACG CGGGATATGT TGGGATGATT GAAATGGCGC GGGAATTGGA CGAAGCCGTT 
CATAGTCCTA TCTGGCGGTT AGTTCGTCAA CCTTCCCCTT GGGATATTTG GCAACAGGAA 
CACGAAAGTT TATTGAATTT AGAAGCGGAA TAA

Protein sequence

MKLTKGKINE LLTQPGCEHN HNKEGQGKNK SCTQQAQPGS AQGGCAFDGA SIALVPITDA 
AHLVHGSIAC SGNSWNSRGS LSSGPMTYKM GFTTDLSEND VIFGGEKKLY QAIAQLVKRY 
HPAAVFVYST CVTALIGDDL DAVCKAATKK YETPIIPVHA PGFVGSKNLG NRLGGEALLD 
HVVGTREPEF TTDFDINLIG EYNVAGEMWG VLPLFEKLGI RVLAKITGDA RYEEVCYAHR 
AKLNLMICSK ALINMATAMQ ERYGIPYIEE SFYGIADMNR CLRNIAEYFG DAALKERVEQ 
LIEEETTKLD LALAPYRERL KGKRVVLYTG GVKSWSVVSA AQDLGMEVVA TSTKKSTEED 
KAKIRELLGK DGIMLEKGSP TELLRVVEQT KADLLVAGGR NQYTALKARI PFLDINQERH 
HPYAGYVGMI EMARELDEAV HSPIWRLVRQ PSPWDIWQQE HESLLNLEAE