Gene Rpal_5099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5099
Symbol
ID	6412793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5483570
End bp	5485129
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	62%
IMG OID	642714984
Product	nitrogenase molybdenum-iron protein beta chain
Protein accession	YP_001994063
Protein GI	192293458
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01286] nitrogenase molybdenum-iron protein beta chain

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGA CCGCAGAGAA GATCCGCGAT CACTTCGAAC TCTTCCGTGA GCCCCAGTAC 
GAAGAGTTGA TGGAGAACAA GCGGAAGAAT TTCGAGAACT ATGTTGGCGA TGCCGAGGTC 
ACGCGCGTCG CGGACTGGAC CAAGACCAAG GAATACCAGG ACAAGAACTT CGCTCGCGAG 
GCTCTCGTCA TCAACCCGGC CAAGGCCTGC CAGCCGCTCG GTGCAGTGTT CGCCGCGGTC 
GGCTTCGAGA AGACGCTGCC GTTCGTGCAC GGCTCGCAGG GCTGCGTTGC CTATTACCGC 
AGCCACTTCA CCCGCCACTT CAAGGAGCCG ACCTCGTGCG TCTCCTCGTC GATGACCGAA 
GACGCCGCGG TGTTCGGCGG CCTCAACAAC ATGATCGACG GCCTGGCCAA CGCCTATGCG 
CTGTACAAGC CGAAGATGAT CGCGGTCTCG ACCACCTGCA TGGCCGAGGT CATCGGTGAC 
GACCTCAACG CGTTCATCAA GAACGCCAAG GAAAAGGGCT CGGTCCCGCA GGAATTCGAC 
GTCACCTACG CCCACACCCC GGCGTTCGTC GGCAGCCACA TCACCGGCTA CGACAACACC 
ATGAAGGGCA TCGTCGAGCA CTTCTGGGAC GGCAAGTCCG GCACCGTGGA AAAGCTCGAG 
CGCAAGCCGA ACGAGTCGAT CAACTTCCTC GGTGGGTTCG ACGGCTACAC CGTCGGCAAC 
ATCCGCGAGA TCAAGCGGAT CTTCGAACTG ATGGGCGTCG ATTACACCAT CTTCGGCGAC 
AACAGCGACG TCTGGGATAC CCCGGCCGAC GGTGAGTTCC GGATGTACGA CGGCGGTACC 
ACGCTGGAGC AGGCCGCCAA CGCGGTCCAC GCCAAGGCGA CGATCTCGAT GCAGGAGTTC 
TGCACCGAGA AGACCCTGGC GACGATCGCC GATCACGGCC AGGAAGTGGT CGCCTTCAAC 
CACCCGGTCG GCATCGCCGG CACCGATCGC TTCCTGCAGG CGGTGTCGCG GATCACCGGC 
AAGGCGATCC CGGAAGCGCT GACCAAGGAG CGCGGCCGTC TGGTTGACGC CATCGGCGAC 
TCCTCGGCCC ACATCCACGG CAAGAAGTTC GCGATCTACG GCGATCCGGA CCTCTGCTAC 
GGCCTCGCCG AATTCATCCT CGAACTCGGC GGCGAGCCGG TCCACATCCT GGCGACCAAC 
GGCAACAAGA CCTGGGAAGC CAAGGTTCAG GCTCTGCTCG ACTCGTCGCC GTTCGGCGCG 
GGCTGCAAGG TCTACGCCGG CAAGGATCTG TGGCACCTGC GGTCGCTGCT GTTCACCGAA 
CCGGTGGACT TCATGATCGG TAACACCTAC GGCAAGTATC TCGAGCGCGA CACGGGCACC 
CCGCTGATCC GTCTCGGCTT CCCGGTGTTC GACCGCCACC ACCACCACCG CTCGCCGGTG 
TGGGGCTATC AGGGGTCGAT GAACGTCCTG GTCAAGATCC TCGACAAGAT CTTCGACGAA 
ATGGACAAGG CGACCAACAC TGCCGGCAAG ACCGACGTCA GCTTCGATAT CATCCGCTGA

Protein sequence

MTETAEKIRD HFELFREPQY EELMENKRKN FENYVGDAEV TRVADWTKTK EYQDKNFARE 
ALVINPAKAC QPLGAVFAAV GFEKTLPFVH GSQGCVAYYR SHFTRHFKEP TSCVSSSMTE 
DAAVFGGLNN MIDGLANAYA LYKPKMIAVS TTCMAEVIGD DLNAFIKNAK EKGSVPQEFD 
VTYAHTPAFV GSHITGYDNT MKGIVEHFWD GKSGTVEKLE RKPNESINFL GGFDGYTVGN 
IREIKRIFEL MGVDYTIFGD NSDVWDTPAD GEFRMYDGGT TLEQAANAVH AKATISMQEF 
CTEKTLATIA DHGQEVVAFN HPVGIAGTDR FLQAVSRITG KAIPEALTKE RGRLVDAIGD 
SSAHIHGKKF AIYGDPDLCY GLAEFILELG GEPVHILATN GNKTWEAKVQ ALLDSSPFGA 
GCKVYAGKDL WHLRSLLFTE PVDFMIGNTY GKYLERDTGT PLIRLGFPVF DRHHHHRSPV 
WGYQGSMNVL VKILDKIFDE MDKATNTAGK TDVSFDIIR