Gene RPC_3968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3968
Symbol
ID	3969391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4420356
End bp	4421483
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	65%
IMG OID	637927072
Product	NAD(P)(+) transhydrogenase (AB-specific)
Protein accession	YP_533813
Protein GI	90425443
COG category	[C] Energy production and conversion
COG ID	[COG3288] NAD/NADP transhydrogenase alpha subunit
TIGRFAM ID	[TIGR00561] NAD(P) transhydrogenase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.52416
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.395533
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTG CTGTTGCTAA AGAACTAGAT CCTGCTGAAC CGAGGGTCGC GGCGACGCCC 
GACACGGTGA AGAAGTTCAA AGCGTTGGGG ATCGATATCG CGATCGAGCC CGGCGCCGGG 
ATCAAGTCCG GACTGCCGGA TCAGGAATTC ACCGCGGTCG GCGCCACCGT CAGCGCCGAT 
GCGCTGAAGG ACGCCGATAT CATCATCAAG GTGAAGCGCC CCGAGGCCTC TGAACTTGCG 
AGCTACAAGC GCGGCGCGCT GGTGATCGCC ATCATGGACC CCTACGGCAA CGAAGCCGCG 
CTGAAGACCA TCGCCGACGC CGGCGTCTCG GCCTTCGCGA TGGAGCTGAT GCCGCGCATC 
ACCCGCGCGC AGGTGATGGA CGTGCTGTCG AGCCAGGCCA ATCTGGCCGG CTACCGCGCC 
GTGATCGAGG CCGCCGAATC GTTCGGCCGC GCCTTTCCGA TGATGATGAC CGCGGCCGGC 
ACGATTCCCG CCGCCAAGGT GTTCGTGATG GGTGTCGGCG TCGCCGGCCT GCAGGCGATC 
GCCACCGCGC GCCGGCTCGG CGCCGTGGTC ACCGCCACCG ACGTGCGCCC CGCCACCAAG 
GAGCAGGTCG AAAGTCTCGG CGCCAAATTC CTCGCCGTCG AAGACGAGGA ATTCAAGAAC 
GCCCAGACCG CCGGCGGCTA CGCCAAGGAA ATGTCCAAAG AGTATCAGGC CAAGCAGGCC 
GCGCTCACCG CCGAGCACAT CAAGAAGCAG GACATCATCA TCACCACCGC GTTGATCCCC 
GGCCGGCCCG CGCCGCGCCT GGTCACCGCC GAGATGGTGG CGTCGATGAA GCCCGGTTCA 
GTGCTGGTTG ACCTCGCGAT CGAGCGCGGC GGCAACGTCG AAGGCGCGGT GGCCGGTCAG 
GTCACCGACG TCGGCGGCAT CAAGATCGTC GGCTACACCA ACGTCGCCGG CCGGGTCGCC 
GCTTCGGCCT CGAGCCTGTA TTCCCGCAAC CTGTTCAACT TCATCGAGAC GCTGTTCGAC 
AAGGCGTCGA AGTCGCTCGC GGTGAAGTGG GACGACGAGT TGGTGAAGGC CACCGCGCTG 
ACCAAAGACG GCGCGGTGAT TCACCCGAAC TTCCAGCCGA AAGCTTAA

Protein sequence

MKIAVAKELD PAEPRVAATP DTVKKFKALG IDIAIEPGAG IKSGLPDQEF TAVGATVSAD 
ALKDADIIIK VKRPEASELA SYKRGALVIA IMDPYGNEAA LKTIADAGVS AFAMELMPRI 
TRAQVMDVLS SQANLAGYRA VIEAAESFGR AFPMMMTAAG TIPAAKVFVM GVGVAGLQAI 
ATARRLGAVV TATDVRPATK EQVESLGAKF LAVEDEEFKN AQTAGGYAKE MSKEYQAKQA 
ALTAEHIKKQ DIIITTALIP GRPAPRLVTA EMVASMKPGS VLVDLAIERG GNVEGAVAGQ 
VTDVGGIKIV GYTNVAGRVA ASASSLYSRN LFNFIETLFD KASKSLAVKW DDELVKATAL 
TKDGAVIHPN FQPKA