Gene RPB_1754 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1754
Symbol	nirA
ID	3909741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	2007058
End bp	2008818
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	68%
IMG OID	637883648
Product	ferredoxin-nitrite reductase
Protein accession	YP_485373
Protein GI	86748877
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0155] Sulfite reductase, beta subunit (hemoprotein)
TIGRFAM ID	[TIGR02435] precorrin-3B synthase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.188302
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00588237
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGGAAGCG AATTCACGAT CGACCAGAAG CGATACCTGG AAGGCTTCGC CACCGGCATC 
AACGCCGCGC GGGTGCAGCG CGGCGCCCTG CCCGCCGCCG GCAGCGCGCA GCCCTCCGGC 
CCCGACGCGA TCCACATCGC CGCGCAGGAT CGCTACACTG CCGCGGGCAA GAAACTCGCC 
GAAGCGGAGA AGTGGAAGCG CGAGGAGCAT CCGTTCGACG CCTATGCGCG GCTGAAGCAG 
CAGGCCAAGA CAAATACGCC GCCGAAGCCG GCCGACAATT TCCGCTGGCG CTTTTACGGG 
CTGTTCTACG TCGCCCCGAC CCAGAGCTCC TATATGTGCC GGTTGCGGAT TCCCAATGGC 
GTGCTGACGT CGTGGCAGAT GCAGGGCCTC GCCGACATCG CCGACAATTG TGCCGGCGGC 
TATTCCCACG TGACGACGCG CGCCAATCTG CAGATGCGCG AGATCGCGCC GAAGAACGCC 
GTGACTCTGA TCGAAGGCAT CGAGTCGCTC GGCCTGTGGG CGCGCGGCGC CGGCGCCGAC 
AACATCCGCA ACGTCACCGG TTCGGCCACC GCCGGCATCG ATCCGCAGGA ATTGCTCGAC 
ACCCGCGCTT ACGCGCGCGA GTGGCACTTC CACATCCTCA ACGAGCGCGC GCTGTACGGC 
CTGCCGCGCA AATTCAACGT CGCCTTCGAC GGTGGCGGGC TGATCCCGAC GCTGGAGGAC 
ACCAACGACA TCGCGTTCCA GGCGGTGACG ATCGGCGACG GCCACGGCGT CGAACCGGGC 
GTGTGGTTCC GGCTCTCGCT CGGCGGCATC ACCGGCCACA AGGATTTTGC CCGCGACACC 
GGCGTGATCG TGCCGCCGGA TGAAGCGACC GAAGTCTCGG ACGCGATCGT GCGGGTGTTC 
ATCGAGCACG GCGACCGCAC CGACCGGGCC AGGTCGCGGC TGAAATACGT GCTCGACCGT 
TTCGGCTTCG ATGAGTTTCT CAGGCGGGTC GAGGGGCGGC TCGGACGCAA GCTGGTGCGC 
GTGCCCGCGG AGGCCGCGCA GCCACGGCCG GCGCAGGATC GCGCCGCGCA TATCGGCGTC 
CATCGCCAGA AGCAGGCCGG GCTGAACTGG ATCGGCGTGC GGCTGCCGCT CGGCAAGCTG 
ACGAGCGCGC AGATGCGCGG CCTCGCCGAG ATTGCGCACA ATTTCGGCGA CGGCGATATC 
CGGCTGACCG TGTGGCAGAA CCTGTTGATC TCCGGCGTTC CGGACGCGCG TGTCGCGGAC 
GCAAGTGCGG CGATCGTCGC GCTCGGCCTC GCGATCGACG CCAGTCCGAT CCGCGCCGGA 
CTGATCGCCT GCACTGGCGC CACCGGCTGC CGGTTCGGCG CCGCCAAGAC CAAGGAAACC 
GCCGAAGCCA TCGCGGGCTA TTGCGAGCCG CGGGTGCCAC TCGACACGCC GGTGAACATC 
CACCTCACCG GCTGCCATCA TTCCTGCGCG CAACATTACA TCAGCGACAT CGGCCTGATC 
GGCGCCAAGG TGGCGATCTC CGACGAAGAC ACCGTCGAGG GCTTCCACAT CCATGTCGGC 
GGTGCGTTCG GCGAAGGCGC CGCGATCGGC GCCGAAGTGC TGCGCGACGT CAGACAGGAC 
GACGCGCCGC GTGTCATCGC GCAAATGCTG AGCACGTATC TCGCGCAACG CGCTTCGCCG 
GACGAAACCT TCCTCGCCTT CGCGCGCCGC CACGACACCC CGACGCTGCA ACGTCTGTTC 
GCTCTGGAGA CCGGTGCATG A

Protein sequence

MGSEFTIDQK RYLEGFATGI NAARVQRGAL PAAGSAQPSG PDAIHIAAQD RYTAAGKKLA 
EAEKWKREEH PFDAYARLKQ QAKTNTPPKP ADNFRWRFYG LFYVAPTQSS YMCRLRIPNG 
VLTSWQMQGL ADIADNCAGG YSHVTTRANL QMREIAPKNA VTLIEGIESL GLWARGAGAD 
NIRNVTGSAT AGIDPQELLD TRAYAREWHF HILNERALYG LPRKFNVAFD GGGLIPTLED 
TNDIAFQAVT IGDGHGVEPG VWFRLSLGGI TGHKDFARDT GVIVPPDEAT EVSDAIVRVF 
IEHGDRTDRA RSRLKYVLDR FGFDEFLRRV EGRLGRKLVR VPAEAAQPRP AQDRAAHIGV 
HRQKQAGLNW IGVRLPLGKL TSAQMRGLAE IAHNFGDGDI RLTVWQNLLI SGVPDARVAD 
ASAAIVALGL AIDASPIRAG LIACTGATGC RFGAAKTKET AEAIAGYCEP RVPLDTPVNI 
HLTGCHHSCA QHYISDIGLI GAKVAISDED TVEGFHIHVG GAFGEGAAIG AEVLRDVRQD 
DAPRVIAQML STYLAQRASP DETFLAFARR HDTPTLQRLF ALETGA