Gene Rsph17025_1998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1998
Symbol
ID	5082362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	2040466
End bp	2041503
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	64%
IMG OID	640483560
Product	NADH dehydrogenase subunit H
Protein accession	YP_001168194
Protein GI	146278035
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.222188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGAGT TCATGAATTC GGGGATGGGC ATCATCCTCA CGATCGCGGC GCAGGGGCTT 
CTGGTCATAG CCTTCGTGAT GATCTCGCTT CTGTTCCTCG TCTATGGCGA CCGCAAGATC 
TGGGCGGCGG TGCAGATGCG GCGCGGCCCG AACGTGGTGG GCGCCTTCGG CCTGCTGCAG 
ACGGTGGCCG ATGCCGCGAA ATACGTCTTC AAGGAGGTCG TGGTTCCCGC GGGCGTGGAC 
CGGCCGGTGT TCTTCCTTGC GCCGCTGCTC TCCTTCGTGC TGGCGGTGCT GGCCTGGGCC 
GTGATCCCCT TCAGCCCCGG CTGGGTGCTG TCGGACATCA ACGTGGCGAT CCTGTTCGTC 
TTCGCCGTCT CCTCGCTCGA GGTCTATGGC GTGATCATGG GCGGCTGGGC CTCGAACTCG 
AAATATCCGT TCCTCGGCTC GCTGCGTTCG GCGGCGCAGA TGATCTCGTA CGAGGTGTCG 
CTGGGGCTGA TCATCATCGG GATCATCATC TCGACGGGTT CGATGAACCT GACCCACATC 
GTCGAGGCGC AGGCGGGCCC GTTCGGGATC TTCAACTGGT ACTGGCTGCC GCACCTGCCG 
ATGGTGGCGC TGTTCTTCAT CTCGGCGCTG GCCGAGACCA ACCGCCCGCC CTTCGACCTG 
CCGGAAGCGG AATCCGAACT CGTGGCCGGC TTCCAGGTCG AATACAGCTC GACCCCGTTC 
CTGCTGTTCA TGGCGGGCGA ATATATCGCC ATCTTCCTGA TGTGCGCGCT GATGAGCCTT 
CTGTTCTTCG GCGGCTGGCT CTCGCCCATT CCGGGGCTGC CCGACGGCGC GCTCTGGATG 
GTGCTGAAGA TGGGCTTCTT CTTCTTCCTG TTCGCGATGG TGAAGGCCAT CGTGCCGCGC 
TACCGCTACG ACCAGCTCAT GCGGATCGGC TGGAAGGTGT TCCTGCCCCT CAGCCTCGCC 
TGGGTGGTTC TCGTGGCGTT CCTTGCGAAA TTCGAAGTGT TCGGCGGCTT CTGGGCCCGC 
TGGGCGATGG GGGGCTGA

Protein sequence

MDEFMNSGMG IILTIAAQGL LVIAFVMISL LFLVYGDRKI WAAVQMRRGP NVVGAFGLLQ 
TVADAAKYVF KEVVVPAGVD RPVFFLAPLL SFVLAVLAWA VIPFSPGWVL SDINVAILFV 
FAVSSLEVYG VIMGGWASNS KYPFLGSLRS AAQMISYEVS LGLIIIGIII STGSMNLTHI 
VEAQAGPFGI FNWYWLPHLP MVALFFISAL AETNRPPFDL PEAESELVAG FQVEYSSTPF 
LLFMAGEYIA IFLMCALMSL LFFGGWLSPI PGLPDGALWM VLKMGFFFFL FAMVKAIVPR 
YRYDQLMRIG WKVFLPLSLA WVVLVAFLAK FEVFGGFWAR WAMGG