Gene Rsph17029_2190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2190
Symbol
ID	4895849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2320133
End bp	2321683
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	64%
IMG OID	640112784
Product	nitrogenase molybdenum-iron protein beta chain
Protein accession	YP_001044065
Protein GI	126462951
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01286] nitrogenase molybdenum-iron protein beta chain

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0387614
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.12949
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGACGG CCAGCAGAAG GATCATGCTC ATGCCGCAGT CGGCCGAAAA GGTTCTGGAT 
CACAAGGATC TGTTCAAGGA ACCCGAATAT CAGGCGATGC TCGAGAAGAA GCGCGCCACC 
TACGAGAATG CGACGCCCGC CGAGACGGTG GCCGAAACCG CGGACTGGAC GAAGTCCTGG 
GACTATCGCG AGAAGAACCT CGCCCGCTCC TGCGTGACCA TCAACCCGGC CAAGGCCTGC 
CAGCCGCTGG GCGCGGTCTT CGCCGCCGCC GGCTATGACA GCACCATGAG CTTCGTGCAC 
GGCTCGCAGG GCTGCGTGGC CTACTATCGC TCGCACCTCG CCCGCCACTT CAAGGAGCCG 
TCCTCGGCGG TGTCCTCCTC GATGACCGAG GATGCGGCGG TGTTCGGCGG CCTGAACAAC 
ATGGTGGAGG GCCTCGCCAA CACCTATGCG CTCTATTCGC CGAAGATGAT CGCGGTTTCC 
ACCACCTGCA TGGCGGAAGT CATCGGCGAC GACCTCAACT CCTTCATCAT CAAGTCGAAG 
GAAAAGGAAA GCGTCCCGGC CGACTTCCCG GTGCCCTTCG CCCATACGCC GGCCTTCGTG 
GGCAGCCACG TCGACGGCTA CGACAACATG CAGAAGGGCA TCCTGTCGAA CTTCTGGAAG 
GACGCGCCGC GCACCGCGGG CGAAGGCCTG AACATCATCC CGGGCTTTGA CGGCTACTGC 
GTGGGCAACG TCCGCGAGAT GAAGCGCATG CTCGGCCTGA TGGGCGTCGA GGCGACCGTT 
CTGGGCGATG CCTCGGATGT CTACGACACC CCCTCCGATG GCGAATACCG CATGTATGCG 
GGCGGCACCA CGCAGGAGGA GATCAAGGAG GCCCTGAACG CGAAGGCCAC CCTCTCGCTG 
CAGGAATATT GCACCCGCAG GACGCTCGCC TTCTGCGAGG AAGTGGGCCA GGAAACCGCC 
TCGTTCCACT ATCCGATGGG CGTCAAGGCC ACCGACGAGT TCTTGATGAA GGTCTCGGAC 
CTGACCGGCA AGGAAATCCC GGAAGCGCTC CGCCTCGAGC GCGGCCGCCT GATCGACGCC 
ATGGCCGACA GCCAGGCCTA TCTGCACGGC AAGACCTACG CCATCTTCGG CGATCCCGAC 
TTCGTCTATG CGATGGCCCG CTTCGTGATG GAGATGGGCG GCGAGCCGAA GCACTGCCTC 
GCCACCAACG GCGGCAAGGA CTGGGAAGTG CAGATGAAGG AGCTGCTGGC CTCCTCGCCC 
TTCGGCGAAG GCTGCCAGGT CTGGGCGGGC AAGGACCTCT GGCACCTGCG CTCGATCCTC 
GCCACGGAAC CGGCGGACCT GCTGATCGGC AGCAGCTACG GCAAGTATCT CGAGCGCGAC 
TGCAACGTGC CGCTGATCCG CCTGACCTTC CCGATCTTCG ACCGCCACCA CCACCACCGC 
TTCCCGACCT TCGGCTATCA GGGCGCGATC CAGGTGCTGG TGAAGATCCT CGACAAGATC 
TTCGACAAGC TCGACGACGA GTCCGACATC TCGTTCGACC TGACCCGCTG A

Protein sequence

MRTASRRIML MPQSAEKVLD HKDLFKEPEY QAMLEKKRAT YENATPAETV AETADWTKSW 
DYREKNLARS CVTINPAKAC QPLGAVFAAA GYDSTMSFVH GSQGCVAYYR SHLARHFKEP 
SSAVSSSMTE DAAVFGGLNN MVEGLANTYA LYSPKMIAVS TTCMAEVIGD DLNSFIIKSK 
EKESVPADFP VPFAHTPAFV GSHVDGYDNM QKGILSNFWK DAPRTAGEGL NIIPGFDGYC 
VGNVREMKRM LGLMGVEATV LGDASDVYDT PSDGEYRMYA GGTTQEEIKE ALNAKATLSL 
QEYCTRRTLA FCEEVGQETA SFHYPMGVKA TDEFLMKVSD LTGKEIPEAL RLERGRLIDA 
MADSQAYLHG KTYAIFGDPD FVYAMARFVM EMGGEPKHCL ATNGGKDWEV QMKELLASSP 
FGEGCQVWAG KDLWHLRSIL ATEPADLLIG SSYGKYLERD CNVPLIRLTF PIFDRHHHHR 
FPTFGYQGAI QVLVKILDKI FDKLDDESDI SFDLTR