Gene Rsph17029_1184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1184
Symbol
ID	4895770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1228872
End bp	1229897
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	64%
IMG OID	640111770
Product	NADH dehydrogenase subunit H
Protein accession	YP_001043066
Protein GI	126461952
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.503975
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.452124
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCCG GGATGGGTAT CATCCTCACG ATCGCGGCGC AGGGCCTTCT GGTCATCGCT 
TTCGTGATGA TCTCGCTGCT GTTCCTCGTC TATGGCGACC GGAAGATCTG GGCGGCGGTG 
CAGCTGCGCC GCGGGCCGAA CGTCGTGGGC GCCTTCGGCC TGCTGCAGAC GGTGGCGGAT 
GCGGCCAAAT ACATCTTCAA GGAAGTGGTG GTGCCCGCGG GCGTGGACCG CCCGGTCTTC 
TTCCTCGCGC CGCTCATCTC CTTCGTGCTG GCCGTGCTCG CCTGGGCCGT GATCCCCTTC 
AGCCCGGGCT GGGTGCTGTC GGACATCAAC GTGGCGATCC TCTTCGTCTT CGCCGCCTCC 
TCGCTCGAGG TCTATGGCGT CATCATGGGC GGCTGGGCCT CGAACTCGAA ATATCCGTTC 
CTGGGCAGCC TCCGCTCGGC CGCGCAGATG ATCTCCTACG AGGTCTCGCT CGGCCTCATC 
ATCATCGGGA TCATCATCTC GACCGGCTCG ATGAACCTGA GCCATATCGT CGAGGCGCAG 
GACGGCGCCT TCGGGCTCTT CAACTGGTAC TGGCTGCCGC ACCTGCCGAT GGTGGCGCTG 
TTCTTCATCT CGGCGCTGGC CGAAACGAAC CGCCCGCCCT TCGACCTGCC GGAGGCGGAA 
TCCGAACTGG TCGCGGGCTT CCAGGTGGAA TACAGCTCGA CGCCGTTCCT GCTGTTCATG 
GCCGGCGAAT ATATCGCCAT CTTCCTCATG TGCGCGTTGA TGAGCCTGCT GTTCTTCGGC 
GGCTGGCTCT CGCCCATCCC CGGACTGCCC GACGGCGTGT TCTGGATGGT GGCGAAGATG 
GCCTTCTTCT TCTTCCTCTT CGCCATGGTG AAAGCCATCG TGCCGCGCTA CCGCTACGAC 
CAGCTCATGC GGATCGGCTG GAAGGTCTTC CTTCCCTTCA GCCTCGGCTG GGTGGTTCTG 
GTGGCGTTCC TTGCGAAATT CGAAGTGTTC GGCGGCTTCT GGGCCCGCTG GGCGATGGGA 
GGCTGA

Protein sequence

MNSGMGIILT IAAQGLLVIA FVMISLLFLV YGDRKIWAAV QLRRGPNVVG AFGLLQTVAD 
AAKYIFKEVV VPAGVDRPVF FLAPLISFVL AVLAWAVIPF SPGWVLSDIN VAILFVFAAS 
SLEVYGVIMG GWASNSKYPF LGSLRSAAQM ISYEVSLGLI IIGIIISTGS MNLSHIVEAQ 
DGAFGLFNWY WLPHLPMVAL FFISALAETN RPPFDLPEAE SELVAGFQVE YSSTPFLLFM 
AGEYIAIFLM CALMSLLFFG GWLSPIPGLP DGVFWMVAKM AFFFFLFAMV KAIVPRYRYD 
QLMRIGWKVF LPFSLGWVVL VAFLAKFEVF GGFWARWAMG G