Gene RPD_3736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3736
Symbol
ID	4024252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4173062
End bp	4174348
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	65%
IMG OID	637963940
Product	light-independent protochlorophyllide reductase subunit N
Protein accession	YP_570858
Protein GI	91978199
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01279] light-independent protochlorophyllide reductase, N subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.255529
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00206765
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTGTTC ATGTCTCCAA TTGCGCCGCG ACAGCGGAAG ACCCCGTCTC GCGCGAAATC 
CGCACCGAGA GCGGCCAGCG CGAAGTGTTC TGCGGCCTCA CCGGAATCGT CTGGCTGCAT 
CGCAAGATTC AGGACGCGTT CTTCCTCGTG GTCGGCTCGC GCACCTGCGC GCATCTGATC 
CAGTCGGCTG CCGGCGTGAT GATTTTTGCC GAGCCGCGGT TCGGCACTGC GATCATGGAA 
GAGAAGGATC TCGCCGGTCT CACCGACGCC AATATCGAGC TCGACCGGAT CGTCACACAA 
TTGCTGACGC GGCGGCCCGA CATCAAGTTG CTGTTTCTGG TCGGCTCTTG CCCGTCCGAA 
GTGATCAAGC TCGATTTGTC GCGGGCGGCG CTGCGGCTGT CACAGCGCTT CTCGCCCGGC 
GTGCGTATCC TGAACTACTC GGGCAGTGGC ATCGAGACCA CCTTCACCCA GGGCGAGGAT 
GCCTGCCTCG CGTCACTGGT GCCGGAGTTG CCCGCCGCGC AGGACGAGAA GTCGTCGCTC 
CTGGTGGTCG GCTCGCTCGC CGACGTCGTC GAAGATCAGT TCATGCGGAT GTTCGATGCG 
CTCGGCATCG GTCCCGTGCA GTTCTTCCCG CCGCGCAAAT CGACCGCGCT GCCGAGCGTC 
GGTCCGAATA CCAAGATCCT GATGGCGCAG CCGTTCCTGC CGGATACGGT GCGTGCGCTG 
CAGGAACGCG GCGCCAAGCG GCTGGCCGCG CCGTTCCCGC TCGGGGTTGA AGGCACCACC 
GGCTGGCTGC GTGCCGCGGC CGACGCGTTC GGAGTCGATC CTGCGCATTT CGACAAGGTC 
ACCGGTCCGA ACCGCGCTCG CGCCGAACGC GCGCTTGCGG CTTACCGGAC CGAACTCGCA 
GATCGTCGTA TCTTCTTCTT CCCCGACTCC CAGCTCGAGA TTCCGCTGGC GCGTTTCCTG 
TCGCGCGAGC TGTCGATGAA GCTGGTCGAA GTCGGCACGC CCTATCTGCA TCGCGAGCAT 
CTCGCGGAAG AGTTGAAGCT GCTGCCCGCC GGCGTCGCGA TAACAGAAGG TCAGGACGTC 
GACCTTCAGC TCGACCGCTG CCGGCTCGCG CGTCCCGACA TCGTGGTGTG CGGTCTCGGC 
CTTGCCAATC CGCTCGAAGC CGAAGGCATC ACGACCAAAT GGTCGATCGA ACTCGTGTTC 
ACCCCGATCC AGGGGTACGA GCAGGCGGCC GACCTCGCTG AATTGTTCGC GCGTCCGCTC 
GTGCGCCGCG CCAAGCTGGT GGCCTGA

Protein sequence

MTVHVSNCAA TAEDPVSREI RTESGQREVF CGLTGIVWLH RKIQDAFFLV VGSRTCAHLI 
QSAAGVMIFA EPRFGTAIME EKDLAGLTDA NIELDRIVTQ LLTRRPDIKL LFLVGSCPSE 
VIKLDLSRAA LRLSQRFSPG VRILNYSGSG IETTFTQGED ACLASLVPEL PAAQDEKSSL 
LVVGSLADVV EDQFMRMFDA LGIGPVQFFP PRKSTALPSV GPNTKILMAQ PFLPDTVRAL 
QERGAKRLAA PFPLGVEGTT GWLRAAADAF GVDPAHFDKV TGPNRARAER ALAAYRTELA 
DRRIFFFPDS QLEIPLARFL SRELSMKLVE VGTPYLHREH LAEELKLLPA GVAITEGQDV 
DLQLDRCRLA RPDIVVCGLG LANPLEAEGI TTKWSIELVF TPIQGYEQAA DLAELFARPL 
VRRAKLVA