Gene Rcas_2091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2091
Symbol
ID	5539571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2683311
End bp	2684435
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	57%
IMG OID	640894226
Product	NADH dehydrogenase (quinone)
Protein accession	YP_001432195
Protein GI	156742066
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCAAA CGCAGGAACT CCAGATCAAT ATCGGTCCGC AGCACCCATC GACGCACGGG 
GTCTTTCGGA TGATCGTCAC CGTTGATGGT GAGACGATCA TCGATCTCAA GCCGGTCTTC 
GGGTATCTGC ACCGCAATCA CGAGCAACTG GCGGAAGTCT CGACGTATAT TCAGTCGATG 
CCATACACCG ACCGGCTCGA TTATTTCAAT TCGATGGCGA ATAACCACGC GCTGGCGCTG 
GCAGTCGAGA AACTGGCCGG TATCAGTGTG CCGCAGCGTG CCGAGTATAT TCGCGTGCTG 
ATGGTCGAAC TGACCCGCAT TCTCAACCAT GCCTCGGCGG TTGGCTTTCT GCTGAACGAC 
ATGGGCGCAT GGCAGACGCC GTTGATGTTT GGGATGCGCG AGCGAGAGAA GATTCTTGAC 
CTGTTCGAGA TGGCGAGCGG CGCGCGGATG ATGTGCAATT ACTTCCGCTT CGGCGGCGTG 
TGGCGCGACC TTCCGCCGGA GTTTATTCCG CAACTCAAGG AGTTGATGCA AGGGTTGCCA 
TCGTTCTTCG ATGAGTTCGA GCGCCTGCTG CGAGAAAATG AAATCCTGCT GTCGCGCACG 
GTGAATGTTG GTATTTTGCC AAAAGAAGTT GCTGTTTCGT ACAGCGTCAC CGGCCCGGTG 
TTGCGCGCGT CGGGTATTCC GTATGATGTG CGCCGCGCTG AACCATATAG CGTGTACGGT 
GATCTTGACT TCGACATTCC GATCGGGTCG GTGGGGGATG TGTATGATCG TTTCCTGATC 
CGTATCGAGG AGATGCGTCA GAGTTATCGC ATCCTGCAAC AGGTGATCGA GCGCCTGCCC 
GATACCACTG GCGGACATAT CAACCCGGCG ATGGCGAACA TCGGTAAACA GAAGGCGCTG 
CGCCCGCCGC CGGGTGATGC GTATGCGCGC ATTGAGTCGC CTAAGGGGGA ACTCGGCTTT 
TACCTGGTGA GCGATGGCAG TGAGCGACCG TATCGCTATA AGGTGCGCGC GCCGTCGTTT 
ATCAACCTGA CGCCCCTCGG CGATATGTGC CGTGGGCATA AGGTCGCCGA TGTGGTGGTT 
ATCCTCGGCA GTATCGATAT TGTGATGGGT GAGGTGGATC GGTAG

Protein sequence

MLQTQELQIN IGPQHPSTHG VFRMIVTVDG ETIIDLKPVF GYLHRNHEQL AEVSTYIQSM 
PYTDRLDYFN SMANNHALAL AVEKLAGISV PQRAEYIRVL MVELTRILNH ASAVGFLLND 
MGAWQTPLMF GMREREKILD LFEMASGARM MCNYFRFGGV WRDLPPEFIP QLKELMQGLP 
SFFDEFERLL RENEILLSRT VNVGILPKEV AVSYSVTGPV LRASGIPYDV RRAEPYSVYG 
DLDFDIPIGS VGDVYDRFLI RIEEMRQSYR ILQQVIERLP DTTGGHINPA MANIGKQKAL 
RPPPGDAYAR IESPKGELGF YLVSDGSERP YRYKVRAPSF INLTPLGDMC RGHKVADVVV 
ILGSIDIVMG EVDR