Gene RPB_3981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3981
Symbol
ID	3911788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4547592
End bp	4548878
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	67%
IMG OID	637885885
Product	light-independent protochlorophyllide reductase subunit N
Protein accession	YP_487585
Protein GI	86751089
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01279] light-independent protochlorophyllide reductase, N subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.120682
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCC ACGTGCAGCC CTGCGCCGCG CCAGCGGAAG ATCCTGTCTC GCGTGCGGTT 
CGCACCGAGA GCGGCCAGCG CGAAGTCTTC TGCGGTCTCA CCGGCATCGT CTGGCTTCAC 
CGCAAGATTC AGGACGCGTT CTTCCTGGTC GTCGGCTCGC GTACTTGTGC GCATCTGATC 
CAGTCGGCCG CCGGCGTGAT GATCTTCGCC GAACCGCGCT TCGGCACCGC CATCATGGAA 
GAGAAGGACC TCGCCGGTCT CACCGACGCC AATGACGAAC TCGATCGCAT CGTCACGCAG 
TTGCTGACCC GGCGGCCCGA CATCAAGCTG CTGTTCCTCG TCGGTTCCTG CCCGTCGGAA 
GTGATCAAGC TCGATCTGTC GCGCGCGGCG CTGCGGCTGT CGCAGCGGTT CTCGCCCGGC 
GTGCGCATCC TGAACTACTC TGGCAGCGGC ATCGAGACCA CCTTCACCCA GGGCGAGGAT 
TCCTGCCTCG CGTCGCTGGT GCCGGCATTG CCCGCGGCCC AGGACGAAAC GTCGTCGCTG 
CTGGTGATAG GCTCGCTCGC CGACGTCGTC GAGGACCAGT TCATGCGGAT GTTCGATGCG 
CTCGGCATCG GCCCCGTGCA GTTCTTTCCG CCGCGCAAAT CGACCGCGCT GCCGAGCGTT 
GGCCCGAACA CCAAGATCCT GATGGCGCAG CCGTTCCTGC CGGACACCGT GCGTGCGCTG 
CAGGAGCGCG GCGCCAAGCG GCTGGCCGCG CCGTTCCCGC TCGGCGTCGA AGGCACCACC 
GGCTGGCTGC GCGCCGCCGC CGATGCATTT GGGATCGACG CTGCGACATT CGACCGGGTG 
ACGGAGCCGA ACCGCGTCCG TGCCGAACGC GCGCTCGGCG CCTACAAGGC CGAACTCGGT 
GGCCGCCGGA TTTTCTTCTT TCCCGACTCC CAGCTCGAAA TTCCGCTGGC GCGGTTTCTC 
GCGCGCGAGC TGTCGATGCA ATTGGTCGAG GTCGGCACGC CGTATCTGCA CCGCGAGCAT 
CTCGCGGAGG AGCTGAAGCT GCTGCCCGCC GGCGTCGCGC TGACCGAAGG TCAGGACGTC 
GACCTGCAGC TCGACCGCTG CCGGCTTGCA CGTCCCGACA TCGCCGTCTG CGGTCTCGGC 
CTCGCCAATC CGCTCGAGGC CGAAGGCATC ACCACGAAGT GGTCGATTGA ACTCGTCTTC 
ACCCCGATCC AGGGGTACGA GCAGGCGGCC GACCTCGCTG AATTGTTCGC GCGCCCGCTC 
GTCCGTCGCG CCAAGCTGGT GGCCTGA

Protein sequence

MTVHVQPCAA PAEDPVSRAV RTESGQREVF CGLTGIVWLH RKIQDAFFLV VGSRTCAHLI 
QSAAGVMIFA EPRFGTAIME EKDLAGLTDA NDELDRIVTQ LLTRRPDIKL LFLVGSCPSE 
VIKLDLSRAA LRLSQRFSPG VRILNYSGSG IETTFTQGED SCLASLVPAL PAAQDETSSL 
LVIGSLADVV EDQFMRMFDA LGIGPVQFFP PRKSTALPSV GPNTKILMAQ PFLPDTVRAL 
QERGAKRLAA PFPLGVEGTT GWLRAAADAF GIDAATFDRV TEPNRVRAER ALGAYKAELG 
GRRIFFFPDS QLEIPLARFL ARELSMQLVE VGTPYLHREH LAEELKLLPA GVALTEGQDV 
DLQLDRCRLA RPDIAVCGLG LANPLEAEGI TTKWSIELVF TPIQGYEQAA DLAELFARPL 
VRRAKLVA