Gene PCC8801_1010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1010
Symbol
ID	7104235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1064033
End bp	1065151
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	45%
IMG OID	643474102
Product	NADH dehydrogenase subunit H
Protein accession	YP_002371242
Protein GI	218245871
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACAG GAATTGACCT ACAAGGCAGT TTTATCGAAT CTCTCAAACA ATTGGGACTT 
CCTGACGGAG TAGCCAAAGC CCTCTGGATT CCCTTACCCT CTTTTTTAAT GATTATTGGA 
GCTACCGTCG GCGTATTAGT CGTGGTTTGG TTAGAACGGA AGATCTCCGC AGCCGCCCAA 
CAACGCATCG GACCCGAATA TGCTGGACCG TTGGGGGTAC TTCAACCTGT AGCCGACGGG 
ATCAAATTAG TGTTTAAGGA AGACATTATT CCGGCCAAAG CTGACCCTTG GCTATTTACC 
CTGGGACCCG TTTTAGTGGT GCTCCCTGTT TTTGTTTCCT ATCTCATTGT TCCCTTTGGT 
CAGAATTTAG TGATAACTGA CCTCAATGTT GGCATTTTTC TCTGGATTTC TCTGTCAAGC 
ATTGCCCCCA TCGGGTTATT GATGTCCGGA TATGCTTCTA ATAATAAATA TTCCCTTCTG 
GGGGGCTTAA GGGCAGCAGC GCAGTCTATT AGCTACGAAA TTCCCCTTGC GTTTTCTGTC 
CTAGCGATCG CTATGATGTC CAATAGCCTA AGTACCATCG ATATCGTGCA ACAACAGTCA 
GGATACGGTA TTTTAGGCTG GAATGTCTGG CGACAACCCG TTGGCTTAAT TATCTTTTGG 
ATTGCTGCCT TAGCTGAGTG CGAACGCCTT CCCTTTGACC TTCCTGAAGC GGAAGAAGAA 
ATCGTCGCAG GGTATCAAAC CGAATATTCT GGGATGAAAT TTGGGTTATT TTACGTTGGA 
TCTTACGTTA ACTTGGTGTT ATCCGCCTTA GTCTTTGCTA TTCTCTATCT AGGCGGTTGG 
GAATTTCCCG TTCCCCTCGA TAAATTAGCA GGATGGTTAG GAGTTAATGA TAACAGTCCT 
TGGTTACAGG TGATCACGGC ATCTCTGGGG ATTACCATGA CCGTCCTTAA AGCTTATTTT 
CTGGTATTTA TTGCCGTTTT GTTGCGCTGG ACAGTACCGA GGGTTCGTAT TGACCAACTC 
CTGAATTTAG GCTGGAAATT CTTGCTTCCC GTATCCTTAG TAAATCTGTT ATTAACGGCA 
GCCCTAAAAT TAGCGTTTCC CGTTGCTTTT GGTGGCTAA

Protein sequence

MNTGIDLQGS FIESLKQLGL PDGVAKALWI PLPSFLMIIG ATVGVLVVVW LERKISAAAQ 
QRIGPEYAGP LGVLQPVADG IKLVFKEDII PAKADPWLFT LGPVLVVLPV FVSYLIVPFG 
QNLVITDLNV GIFLWISLSS IAPIGLLMSG YASNNKYSLL GGLRAAAQSI SYEIPLAFSV 
LAIAMMSNSL STIDIVQQQS GYGILGWNVW RQPVGLIIFW IAALAECERL PFDLPEAEEE 
IVAGYQTEYS GMKFGLFYVG SYVNLVLSAL VFAILYLGGW EFPVPLDKLA GWLGVNDNSP 
WLQVITASLG ITMTVLKAYF LVFIAVLLRW TVPRVRIDQL LNLGWKFLLP VSLVNLLLTA 
ALKLAFPVAF GG