Gene Rsph17029_2197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2197
Symbol
ID	4895691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2326915
End bp	2328390
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	69%
IMG OID	640112791
Product	nitrogenase cofactor biosynthesis protein NifB
Protein accession	YP_001044072
Protein GI	126462958
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG0535] Predicted Fe-S oxidoreductases [COG1433] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01290] nitrogenase cofactor biosynthesis protein NifB

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.157561
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.878423
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAACA TCATCTCGCT GGGCGGACTA CAGGTCGCGT CGCGCGACGA GCTCGGGCAG 
GCGATGGCGG GCGGCTGCAC CGCTTCCTCC TGCGGGACGA AGGCGGGACC CGCCGACATG 
GACCCGGCGA TCTGGGCCAA GGTGAAGGAT CACCCCTGCT ATTCCGAGGA GGCGCACCAT 
TATTTCGCGC GGATGCATGT CTCGGTGGCG CCCGCCTGTA ACATCCAGTG CAACTACTGC 
AACCGCAAGT ATGACTGCGC CAACGAGAGC CGCCCCGGCG TCGTTTCCGA GCGGCTGACG 
CCCGAGCAGG CGGCGCGCAA GGTGCTGGCC GTGGCCGCCG AGGTGCCGCA GCTGTCGGTG 
CTGGGCATCG CGGGCCCGGG CGATGCGGCC TATGACTGGA AGAAGACGAA GGCCACCTTC 
GACAAGGTTC AGTCGCAGCT GCCCGACATC AAGCTCTGCC TCTCCTCGAA CGGGCTCGCC 
ATGCCCGATC ATGTCGAGGA GATCGTGGCG ATGAACATCG ACCATGTGAC GCTGACCATC 
AACACGCTCG ATCCCGAGGT GGGGGCGAAG ATCTATCCGT GGGTCTTCTT CCGCGGCAAG 
CGGCACGAGG GGGTTGAGGG GGCGGCGATC CTCCTCGCGC GCCAGATGGA GGCGCTCGAC 
ATGCTGGTCG CCCGCGGGGT GCTGGTGAAG GTGAATTCGG TCCTGATCCC CGGCATCAAC 
GATGCGGGCA TGGTCGAGCT GAACCGCGAG GTGAAGGCGA GGGGCGCGTT CCTGCACAAC 
ATCATGCCGC TGATCTCGGA TCCGGCGCAC GGCACCCATT TCGGCCTCAC CGGCCAGCGC 
GGCCCGACGG CGGCCGAGCT TCGGGCGGTG CAGGACCAGT GCGGCGACGG GGCGAACCTG 
ATGAAGCACT GCCGCCAGTG CCGCGCCGAT GCGGTGGGAA TGCTGGGCGA GGACCGCGGG 
CAGGAGTTCA CGCTCGACAA GCTGCCCGAG ACGGTCGCGG AGGATGGCGA GGAGAAGCGC 
GCAGCCTACC GCGACTGGGT GGCGCGCGAG CGGGCCGACC GGCGCGCCGC GACCGAGGCC 
GCGCAGGCCG AGGCCGCCGC CCTCGCCGCG CCGCCGATGC GCGTGGCCGT CTGCACCAGG 
GGCGGCGGGC GCATCAACCA GCATTTCGGC CATGCCACCG AGTTCCAGAT CTACGAGGTG 
GATGCGGGCG GTGTGCGCTT CCTCACTCAC CGGCGGGCCG ACAATTACTG CGTGGGCGGT 
CATGGCGAGA GCGACCGGCT GACCGAGATC GTCCGCACGC TCGAAGGTGT GCCGGTCGTG 
CTCTGCGCCC GCATCGGCGA GGGGCCGCGG TCCCGGATGG CCGAAGCTGG CATCGAGGTG 
ATCGACGCCT GCGCCATGGA TTACATCGAG ACCGCGCTCC TCGACCTCTA TGCCGACCGC 
AACCGCAGCC CCGACGCGGG CGCGCTCAGC GCCTGA

Protein sequence

MANIISLGGL QVASRDELGQ AMAGGCTASS CGTKAGPADM DPAIWAKVKD HPCYSEEAHH 
YFARMHVSVA PACNIQCNYC NRKYDCANES RPGVVSERLT PEQAARKVLA VAAEVPQLSV 
LGIAGPGDAA YDWKKTKATF DKVQSQLPDI KLCLSSNGLA MPDHVEEIVA MNIDHVTLTI 
NTLDPEVGAK IYPWVFFRGK RHEGVEGAAI LLARQMEALD MLVARGVLVK VNSVLIPGIN 
DAGMVELNRE VKARGAFLHN IMPLISDPAH GTHFGLTGQR GPTAAELRAV QDQCGDGANL 
MKHCRQCRAD AVGMLGEDRG QEFTLDKLPE TVAEDGEEKR AAYRDWVARE RADRRAATEA 
AQAEAAALAA PPMRVAVCTR GGGRINQHFG HATEFQIYEV DAGGVRFLTH RRADNYCVGG 
HGESDRLTEI VRTLEGVPVV LCARIGEGPR SRMAEAGIEV IDACAMDYIE TALLDLYADR 
NRSPDAGALS A