Gene RPD_3756 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3756
Symbol
ID	4024272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4193196
End bp	4194194
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	62%
IMG OID	637963960
Product	chlorophyllide reductase iron protein subunit X
Protein accession	YP_570878
Protein GI	91978219
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1348] Nitrogenase subunit NifH (ATPase)
TIGRFAM ID	[TIGR02016] chlorophyllide reductase iron protein subunit X

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00499393
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACGTCG TTCCGACGAT CAACCTGCAA GACGCGCAAC TCCGGGCCGA GGCGTCGATC 
GAGCCCGACG CCCCGGTGAC GACTCCTGTC ACCAAGGAAA CCCAGATTAT CGCGATCTAC 
GGCAAGGGTG GCATCGGCAA GAGCTTCACG CTCGCCAACC TGTCCTACAT GATGGCGCAA 
CAGGGCAAGA AGGTGTTGCT GATCGGCTGC GATCCGAAGA GCGACACCAC GTCTCTGCTG 
TTCGGTGGCA AGGCCTGTCC GACCATTATC GAGACCTCGT CGAAGAAAAA GCTCGCCGGC 
GAGGAAGTGA AGATCGGCGA CGTCTGCTTC AAGCGCGACG GCGTGTTCGC GATGGAGCTC 
GGCGGCCCTG AAGTCGGTCG CGGCTGCGGC GGTCGCGGCA TCATCCACGG TTTCGAACTG 
CTCGAGAAGC TCGGCTTCCA CGAGTGGGGC TTCGACTACG TGCTGCTCGA TTTCCTCGGC 
GACGTGGTAT GCGGCGGCTT CGGTCTGCCG ATCGCGCGCG ACATGTGTCA GAAGGTGATC 
GTGGTCGCAT CCAACGACTT GCAGTCGTTG TATGTCGCCA ACAACGTCTG CTCCGCGGTC 
GAGTATTTCC GCAAGCTCGG CGGCAATGTC GGCGTCGCCG GTATGGTGAT CAACAAGGAC 
GACGGCACCG GCGAGGCGCA GGCCTTCGCC ACTGCGGTGG GCATTCCGGT TCTTTCGGCA 
ATTCCGGCCG ACGACGACAT CCGCAAGAAG AGCGCCAACT ACGAGATCAT CGGCAAGCCC 
GATGGCGAAT GGGGGTCGCT GTTCGAGACC CTGGCGGCGA ATGTCGCGAC CGCGCCGCCA 
GTTCGTCCCA ATCCGCTTAC GCAGGACGGT CTGCTCGGTC TGTTCACGAG CGACATCACC 
GGGCGTGACG TCGTGCTGCT ACCGGCCACG ATCGAAGACA TGTGCGGAGC CTCGGTGCTG 
AACAAGCCGT CGCTCGAAGT CATCTACGAC GCGGTTTGA

Protein sequence

MNVVPTINLQ DAQLRAEASI EPDAPVTTPV TKETQIIAIY GKGGIGKSFT LANLSYMMAQ 
QGKKVLLIGC DPKSDTTSLL FGGKACPTII ETSSKKKLAG EEVKIGDVCF KRDGVFAMEL 
GGPEVGRGCG GRGIIHGFEL LEKLGFHEWG FDYVLLDFLG DVVCGGFGLP IARDMCQKVI 
VVASNDLQSL YVANNVCSAV EYFRKLGGNV GVAGMVINKD DGTGEAQAFA TAVGIPVLSA 
IPADDDIRKK SANYEIIGKP DGEWGSLFET LAANVATAPP VRPNPLTQDG LLGLFTSDIT 
GRDVVLLPAT IEDMCGASVL NKPSLEVIYD AV