Gene Rpal_3297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3297
Symbol
ID	6410967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	3547235
End bp	3548443
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	65%
IMG OID	642713173
Product	NADH dehydrogenase subunit D
Protein accession	YP_001992274
Protein GI	192291669
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGACG CTGCTGCTCC CGACGCTGCC AGCGTCCGCA ACTTCACCAT CAATTTCGGT 
CCGCAGCATC CGGCGGCGCA CGGCGTGCTC CGGCTGGTGC TGGAGCTCGA CGGCGAGGTG 
GTCGAGCGGG TCGATCCGCA TATCGGCCTC CTGCATCGCG GCACCGAGAA GCTGATCGAG 
CAGAAGACCT ATCTGCAGGC GATTCCGTAT TTCGATCGGC TCGATTACGT CGCGCCGATG 
AACCAGGAAC ACGCCTTCTG CCTGGCTGTG GAAAAGCTGC TCGGGATCGC GGTGCCGCGG 
CGCGCCCAAC TGATCCGCGT TCTGTACGCC GAGATCGGCC GCATCCTGTC GCATCTGCTG 
AACGTCACCA CGCAGGCGAT GGACGTCGGC GCGCTGACTC CGCCGCTGTG GGGCTTCGAA 
GAGCGCGAAA AGCTGATGAT GTTCTACGAG CGCGCCTCCG GCAGCCGGAT GCACGCCGCG 
TATTTCCGCG TCGGCGGCGT GCATCAGGAT CTGCCGCCGA AGCTGGTCGA CGACATCGAC 
GCCTGGTGTG ACGCATTCCC GGCGGTGGTG AACGATCTCG ACCGTCTGCT CAGCGACAAC 
CGCATCTTCA AGCAGCGCAA CGTCGATATC GGCGTGGTGA CGCTCGATCA GGCCTGGTCC 
TGGGGCTTCT CCGGCGTGAT GGTGCGCGGC TCCGGCGCGG CCTGGGACCT GCGCAAGTCG 
CAGCCCTACG AATGCTACGC CGAGCTCGAT TTCGAAGTGC CGATCGGCAA GAACGGTGAC 
TGCTACGACC GCTACCACAT CCGCATGGAA GAGATGCGGC AGTCGGTTCG GATCATGAAG 
CAGTGCATTG CCAAGCTGCG GGCGCCGGAC GGGCAGGGGC CGGTTGTGGT CGACGACCAC 
AAGATCTTCC CGCCGCGCCG CGGCGAGATG AAGCGCTCGA TGGAAGCGCT GATCCATCAC 
TTCAAGCTGT ACACCGAGGG CTTCCACGTC CCGGCCGGCG AAGTCTATGT CGCGGTCGAG 
GCGCCGAAGG GCGAGTTCGG CGTGTACCTG GTGTCCGACG GCAGCAACAA GCCTTACAAG 
TGCAAGATCC GTGCGCCGGG CTTCGCCCAT CTGCAGGCGA TGGACTTCCT CAGCCGCGGC 
CATCTGCTCG CCGACGTCTC GGCGATTCTC GGTTCGCTCG ACATCGTGTT CGGAGAGGTC 
GATCGGTGA

Protein sequence

MADAAAPDAA SVRNFTINFG PQHPAAHGVL RLVLELDGEV VERVDPHIGL LHRGTEKLIE 
QKTYLQAIPY FDRLDYVAPM NQEHAFCLAV EKLLGIAVPR RAQLIRVLYA EIGRILSHLL 
NVTTQAMDVG ALTPPLWGFE EREKLMMFYE RASGSRMHAA YFRVGGVHQD LPPKLVDDID 
AWCDAFPAVV NDLDRLLSDN RIFKQRNVDI GVVTLDQAWS WGFSGVMVRG SGAAWDLRKS 
QPYECYAELD FEVPIGKNGD CYDRYHIRME EMRQSVRIMK QCIAKLRAPD GQGPVVVDDH 
KIFPPRRGEM KRSMEALIHH FKLYTEGFHV PAGEVYVAVE APKGEFGVYL VSDGSNKPYK 
CKIRAPGFAH LQAMDFLSRG HLLADVSAIL GSLDIVFGEV DR