Gene Rpal_5111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5111
Symbol
ID	6412805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5492122
End bp	5493678
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	64%
IMG OID	642714996
Product	nitrogenase cofactor biosynthesis protein NifB
Protein accession	YP_001994075
Protein GI	192293470
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR01290] nitrogenase cofactor biosynthesis protein NifB

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAGC TGCTGCAACT GCACGATTTC AGCGCGCTGG GAACGACGTC GTTCGACGAG 
ATGCGCAAGA GCGCGGCGCA ATCGGGCTGC AGCAGCAAAA GCGGCGCCGG CAAGACCGGC 
TGCGGCTCGG CCGCTGGCCC CAGCGATCTG CCGCCGGAAG TCTGGGAGAA GGTGAAGAAT 
CATCCCTGCT ACAGCGAGCA GGCGCATCAT CACTTCGCCC GCATGCACGT CGCGGTCGCG 
CCCGCGTGCA ACATCCAGTG CAATTACTGC AATCGCAAAT ACGATTGCGC CAATGAATCC 
CGTCCCGGCG TGGTCAGCGA GAAGCTGACC CCAGAGCAGG CCGCGCGCAA AGTCGTCGCA 
GTGGCCTCGA CCATCCCGCA GATGACAGTA CTCGGCATCG CCGGTCCGGG TGATGCGCTT 
GCCAATCCGG CCAAGACCTT CAAGACCTTC GAGCTGGTCA CCGAGACCGC GCCCGACATC 
AAGCTGTGCC TGTCGACCAA CGGCCTGATG CTGCCCGACT ATGTCGAGCA GATCGCCGCC 
ATGAAGGTCG ATCACGTCAC CATCACGATC AATATGGTCG ATCCGGAGGT CGGCGCGAAG 
ATCTACCCGT GGATCTTCTA CAATCACCGC CGTTACACCG GCGTCGAGGC GTCGAAGATC 
CTCAGCGAGC GGCAGTTGCT CGGACTGGAG ATGCTGGTCG CACGCGGCAT CCTGGTGAAG 
GTCAACTCGG TGATGATCCC GGGCATTAAC GACGAGCACC TGATCGAGGT CAACAAGGCG 
GTGAAGTCGC GCGGCGCCTT CCTGCACAAC ATCATGCCGC TGATCTCCGA AGCCGAGCAC 
GGCACTGCGT TCGGCCTGTC GGGCCAGCGC GGCCCGACCG CGCAGGAGCT GAAGGCGCTG 
CAGGACGCCT GCGAAGGCGA GATGAACATG ATGCGGCACT GCCGGCAGTG CCGCGCCGAC 
GCGGTCGGCC TGCTCGGCGA GGATCGCAGC GCCGAGTTCA CCACCGAAAA GGTGATGGCG 
ATGGACGTCG AATACGACCT CGCCGCGCGC CAGGCCTACC AGGCCAAGGT CGAGGCCGAG 
CGCGACGCGA TCGCGGTCGC CAAGCAGCGC GAGCTGGAGA AGCTCGCCGA CGAGACGGCG 
ACCATCAAGA TCCAGGTGGC GATCGCCACC AAGGGCGGCG GCGTCATCAA CGAGCACTTC 
GGCCACGCCC ACGAGTTCCA GATCTACGAG GTGTCGACCG CCGGTGCGAA GTTCGTCGGC 
CACCGCCGTG TCGATCTGTA TTGCGAAGGC GGTTACGCCA GCGAAACCGG TATCGAGCCG 
ATCCTCAAGG CGCTGAATGA CTGCACCGCC GTGCTGGTCG CCAAGATCGG CATGTGCCCG 
AAGGACTCGC TCGCCGGTGC CGGCATCGAG GCAGTCGAGA CCTACGCATT CGAATACATC 
GAGCAGTCGG TGATCGCGTA TTTCAAGGAA TACCTGGAAC GCGTCGGCAA GTCGGAGATT 
CGCCACGTCG CGCGAGGCGA TGCCACGATC CGCCAGGGCG CGTTCACCGA GGCCTAG

Protein sequence

MSKLLQLHDF SALGTTSFDE MRKSAAQSGC SSKSGAGKTG CGSAAGPSDL PPEVWEKVKN 
HPCYSEQAHH HFARMHVAVA PACNIQCNYC NRKYDCANES RPGVVSEKLT PEQAARKVVA 
VASTIPQMTV LGIAGPGDAL ANPAKTFKTF ELVTETAPDI KLCLSTNGLM LPDYVEQIAA 
MKVDHVTITI NMVDPEVGAK IYPWIFYNHR RYTGVEASKI LSERQLLGLE MLVARGILVK 
VNSVMIPGIN DEHLIEVNKA VKSRGAFLHN IMPLISEAEH GTAFGLSGQR GPTAQELKAL 
QDACEGEMNM MRHCRQCRAD AVGLLGEDRS AEFTTEKVMA MDVEYDLAAR QAYQAKVEAE 
RDAIAVAKQR ELEKLADETA TIKIQVAIAT KGGGVINEHF GHAHEFQIYE VSTAGAKFVG 
HRRVDLYCEG GYASETGIEP ILKALNDCTA VLVAKIGMCP KDSLAGAGIE AVETYAFEYI 
EQSVIAYFKE YLERVGKSEI RHVARGDATI RQGAFTEA