Gene Cyan8802_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_1039
Symbol
ID	8390348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	1064263
End bp	1065381
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	45%
IMG OID	644979054
Product	NADH dehydrogenase subunit H
Protein accession	YP_003136807
Protein GI	257058919
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000216191
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACACAG GAATTGACCT ACAAGGCAGT TTTATCGAAT CTCTCAAACA ATTGGGACTT 
CCTGACGGAG TAGCCAAAGC CCTCTGGATT CCCTTACCCT CTTTTTTAAT GATTATTGGA 
GCTACCGTCG GCGTATTAGT CGTGGTTTGG TTAGAACGGA AGATCTCCGC AGCCGCCCAA 
CAACGCATCG GACCCGAATA TGCTGGACCG TTGGGGGTAC TTCAACCTGT AGCCGACGGG 
ATCAAATTAG TGTTTAAGGA AGACATTATT CCGGCCAAAG CTGACCCTTG GCTATTTACC 
CTGGGACCCG TTTTAGTGGT GCTCCCTGTT TTTGTTTCCT ATCTCATTGT TCCCTTTGGT 
CAGAATTTAG TGATAACTGA CCTCAATGTT GGCATTTTTC TCTGGATTTC TCTGTCAAGC 
ATTGCCCCCA TCGGGTTATT GATGTCCGGA TATGCTTCTA ATAATAAATA TTCCCTTCTG 
GGGGGCTTAA GGGCAGCAGC GCAGTCTATT AGCTACGAAA TTCCCCTTGC GTTTTCTGTC 
CTAGCGATCG CTATGATGTC CAATAGCCTA AGTACCATCG ATATCGTGCA ACAACAGTCA 
GGATACGGTA TTTTAGGCTG GAATGTCTGG CGACAACCCG TTGGCTTAAT TATCTTCTGG 
ATTGCTGCCT TAGCTGAGTG CGAACGTCTT CCCTTTGACC TTCCTGAAGC GGAAGAAGAA 
ATCGTCGCAG GGTATCAAAC CGAATATTCT GGGATGAAAT TTGGGTTATT TTACGTTGGA 
TCTTACGTTA ACTTGGTGTT ATCCGCCTTA GTCTTTGCTA TTCTCTATCT AGGCGGTTGG 
GAATTTCCCG TTCCCCTCGA TAAATTAGCA GGATGGTTAG GAGTTAATGA TAACAGTCCT 
TGGTTACAGG TGATCACGGC ATCTCTGGGG ATTACCATGA CCGTCCTTAA AGCTTATTTT 
CTGGTATTTA TTGCCGTTTT GTTGCGCTGG ACAGTACCGA GGGTTCGTAT TGACCAACTC 
CTGAATTTAG GCTGGAAATT CTTGCTTCCC GTATCCTTAG TAAATCTGTT ATTAACGGCA 
GCCCTAAAAT TAGCGTTTCC CGTTGCTTTT GGTGGCTAA

Protein sequence

MNTGIDLQGS FIESLKQLGL PDGVAKALWI PLPSFLMIIG ATVGVLVVVW LERKISAAAQ 
QRIGPEYAGP LGVLQPVADG IKLVFKEDII PAKADPWLFT LGPVLVVLPV FVSYLIVPFG 
QNLVITDLNV GIFLWISLSS IAPIGLLMSG YASNNKYSLL GGLRAAAQSI SYEIPLAFSV 
LAIAMMSNSL STIDIVQQQS GYGILGWNVW RQPVGLIIFW IAALAECERL PFDLPEAEEE 
IVAGYQTEYS GMKFGLFYVG SYVNLVLSAL VFAILYLGGW EFPVPLDKLA GWLGVNDNSP 
WLQVITASLG ITMTVLKAYF LVFIAVLLRW TVPRVRIDQL LNLGWKFLLP VSLVNLLLTA 
ALKLAFPVAF GG