Gene Cyan8802_1814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_1814
Symbol
ID	8391128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	1846580
End bp	1848010
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	45%
IMG OID	644979801
Product	nitrogenase molybdenum-iron protein alpha chain
Protein accession	YP_003137548
Protein GI	257059660
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01282] nitrogenase molybdenum-iron protein alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAACAG TAGAAGACAG AAAGCAGCTT ATCCAAGACG TTCTTGATAC CTATCCTGAG 
AAGTTAGCCA AGAAACGGTC TAAACACCTC AATGTTTACG AAGAAGGCAA AGACGATTGT 
GGAGTAAAAT CTAACATTAA GTCTGCACCT GGTGTAATGA CCGCTCGTGG TTGTGCTTAT 
GCAGGATCTA AAGGGGTGGT TTGGGGTCCT ATCAAAGATA TGATCCATAT CTCCCACGGA 
CCTGTTGGTT GCGGTTACTA CTCTTGGTCT GGTCGTCGTA ACTATTACAT CGGAACCACT 
GGGGTTGATA CCTTTGGTAC GATGAACTTT ACCTCTGACT TCCAAGAAAA AGACATCGTT 
TTTGGTGGAG ACAAAAAACT CCTCAAAATC ACCGAAGAAA TCGAAGAATT ATTCCCCCTC 
AACAATGGGA TTTCCATTCA GTCTGAATGT CCTGTTGGAT TAATTGGGGA TGACATCGAA 
GGTGTTGCCA AAAAAGCGCA AAAAATTACT GGCAAACCCG TTATTCCCGT CCGTTGTGAA 
GGATTCCGTG GCGTTTCCCA ATCCTTAGGA CACCACATCG CTAACGACGC AGTGCGTGAC 
TGGGTATTTA GCCGTGATGA TGCTCAAGAA ATCGAAACCA CTCCCTATGA TGTTGCCATC 
ATTGGAGACT ACAACATCGG TGGAGATGCT TGGTCTAGCC GTATTCTTCT TGAAGAAATG 
GGTCTGCGCG TCGTTGCTCA ATGGTCTGGA GACGGAACCA TCAACGAAAT GATGCAAACC 
CCCAAAGTGA AACTCAACCT GATTCACTGT TACCGTTCCA TGAACTACAT CAGTCGTCAC 
ATGGAAGAAA AATACGGTAT TCCCTGGTTT GAGTACAACT TCTTTGGTCC TACCAAGATT 
GCTGAATCCT TACGCGCGAT CGCTGCTCTG TTTGATGACA CCATCAAAGA AAATGCAGAG 
AAAGTCATTG CTAAGTACGA ACAACAAACC GCAGAAGTCT TAGCCAAATA CCGTCCTCGT 
TTGGAAAACA AAACCGTCAT GATGATGGTG GGTGGACTGC GTCCTCGTCA CGTTGTTCCT 
GCTTTCACAG ACTTAGGCAT GAAAATGATC GGAACCGGAT ATGAGTTCGC TCACGGTGAC 
GACTATAAAC GTACCACTGA GTATGTTGAT GATGCAACCC TCATCTATGA TGACGTAACT 
GCTTATGAGT TCGAGAAATT CGTTCAAGAA CTCAAACCCG ACTTAGTCGC TTCTGGCGTT 
AAAGAGAAGT ATGTCTTCCA GAAAATGGGA CTACCTTTCC GTCAAATGCA CTCTTGGGAT 
TACTCTGGTC CTTACCACGG TTATGATGGG TTCGCTATCT TTGCACGGGA TATGGACTTA 
GCTCTCAATA ACCCGACCTG GGGATTAATC AAATCTCCTT GGAATAAGTA A

Protein sequence

MSTVEDRKQL IQDVLDTYPE KLAKKRSKHL NVYEEGKDDC GVKSNIKSAP GVMTARGCAY 
AGSKGVVWGP IKDMIHISHG PVGCGYYSWS GRRNYYIGTT GVDTFGTMNF TSDFQEKDIV 
FGGDKKLLKI TEEIEELFPL NNGISIQSEC PVGLIGDDIE GVAKKAQKIT GKPVIPVRCE 
GFRGVSQSLG HHIANDAVRD WVFSRDDAQE IETTPYDVAI IGDYNIGGDA WSSRILLEEM 
GLRVVAQWSG DGTINEMMQT PKVKLNLIHC YRSMNYISRH MEEKYGIPWF EYNFFGPTKI 
AESLRAIAAL FDDTIKENAE KVIAKYEQQT AEVLAKYRPR LENKTVMMMV GGLRPRHVVP 
AFTDLGMKMI GTGYEFAHGD DYKRTTEYVD DATLIYDDVT AYEFEKFVQE LKPDLVASGV 
KEKYVFQKMG LPFRQMHSWD YSGPYHGYDG FAIFARDMDL ALNNPTWGLI KSPWNK