Gene PCC8801_1786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1786
Symbol
ID	7105556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1871844
End bp	1873274
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	45%
IMG OID	643474854
Product	nitrogenase molybdenum-iron protein alpha chain
Protein accession	YP_002371988
Protein GI	218246617
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01282] nitrogenase molybdenum-iron protein alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAACAG TAGAAGACAG AAAGCAGCTT ATCCAAGACG TTCTTGATAC CTATCCTGAG 
AAGTTAGCCA AGAAACGGTC TAAACACCTC AATGTTTACG AAGAAGGCAA AGACGATTGT 
GGAGTAAAAT CTAACATTAA GTCTGCACCT GGTGTAATGA CCGCTCGTGG TTGTGCTTAT 
GCAGGATCTA AAGGGGTGGT TTGGGGTCCT ATCAAAGATA TGATCCATAT CTCCCACGGA 
CCTGTTGGTT GCGGTTACTA CTCTTGGTCT GGTCGTCGTA ACTATTACAT CGGAACCACT 
GGGGTTGATA CCTTTGGTAC GATGAACTTT ACCTCTGACT TCCAAGAAAA AGACATCGTT 
TTTGGTGGAG ACAAAAAACT CCTCAAAATC ACCGAAGAAA TCGAAGAATT ATTCCCCCTC 
AACAATGGGA TTTCCATTCA GTCTGAATGT CCTGTTGGAT TAATTGGGGA TGACATCGAA 
GGTGTTGCCA AAAAAGCGCA AAAAATTACT GGCAAACCCG TTATTCCCGT CCGTTGTGAA 
GGATTCCGTG GCGTTTCCCA ATCCTTAGGA CACCACATCG CTAACGACGC AGTGCGTGAC 
TGGGTATTTA GCCGTGATGA TGCTCAAGAA ATCGAAACCA CTCCCTATGA TGTTGCCATC 
ATTGGAGACT ACAACATCGG TGGAGATGCT TGGTCTAGCC GTATTCTTCT CGAAGAAATG 
GGTCTGCGCG TCGTTGCTCA ATGGTCTGGA GACGGAACCA TCAACGAAAT GATGCAAACC 
CCCAAAGTGA AACTCAACCT GATTCACTGT TACCGTTCCA TGAACTACAT CAGTCGTCAC 
ATGGAAGAAA AATACGGTAT TCCCTGGTTT GAGTACAACT TCTTTGGTCC TACCAAGATT 
GCTGAATCCT TACGCGCGAT CGCTGCTCTG TTTGATGACA CCATCAAAGA AAATGCAGAG 
AAAGTAATTG CTAAGTACGA ACAACAAACC GCAGAAGTCT TAGCCAAATA CCGTCCTCGT 
TTGGAAAACA AAACCGTCAT GATGATGGTG GGTGGACTAC GTCCTCGTCA CGTTGTTCCT 
GCTTTCACAG ACTTAGGCAT GAAAATGATC GGAACCGGAT ATGAGTTCGC TCACGGTGAC 
GACTATAAAC GTACCACTGA GTATGTTGAT GATGCAACCC TCATCTATGA TGACGTAACT 
GCCTACGAGT TCGAGAAATT CGTTCAAGAA CTGAAACCCG ACTTAGTTGC TTCTGGCGTT 
AAAGAGAAGT ATGTCTTCCA GAAAATGGGA CTACCTTTCC GTCAAATGCA CTCTTGGGAT 
TACTCTGGTC CTTACCACGG TTATGATGGG TTCGCTATCT TTGCACGGGA TATGGACTTA 
GCTCTCAATA ACCCGACCTG GGGATTAATC AAATCTCCTT GGAATAAGTA A

Protein sequence

MSTVEDRKQL IQDVLDTYPE KLAKKRSKHL NVYEEGKDDC GVKSNIKSAP GVMTARGCAY 
AGSKGVVWGP IKDMIHISHG PVGCGYYSWS GRRNYYIGTT GVDTFGTMNF TSDFQEKDIV 
FGGDKKLLKI TEEIEELFPL NNGISIQSEC PVGLIGDDIE GVAKKAQKIT GKPVIPVRCE 
GFRGVSQSLG HHIANDAVRD WVFSRDDAQE IETTPYDVAI IGDYNIGGDA WSSRILLEEM 
GLRVVAQWSG DGTINEMMQT PKVKLNLIHC YRSMNYISRH MEEKYGIPWF EYNFFGPTKI 
AESLRAIAAL FDDTIKENAE KVIAKYEQQT AEVLAKYRPR LENKTVMMMV GGLRPRHVVP 
AFTDLGMKMI GTGYEFAHGD DYKRTTEYVD DATLIYDDVT AYEFEKFVQE LKPDLVASGV 
KEKYVFQKMG LPFRQMHSWD YSGPYHGYDG FAIFARDMDL ALNNPTWGLI KSPWNK