Gene RPB_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4037
Symbol
ID	3911844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4606775
End bp	4608001
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	69%
IMG OID	637885941
Product	NnrS
Protein accession	YP_487641
Protein GI	86751145
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3213] Uncharacterized protein involved in response to NO
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCA CGACGATCGA TCCTTCCGCT TCCGGCCCGG CCAAGCGCAA GCCGGTGCCG 
CGCTATCGCG AGCAGGGCGG CTTGACCCTG CTGTCCGCCG GCTTCCGGCC GTTCTTCTTC 
TTCGGCGCCG TGTTCGCGGC CGTCGCCGTG CTGCTGTGGC TGCCGGTGTA TTACGGCGAC 
CTGACGCTAC AGACCGCGTT CGCGCCGCGC GACTGGCACG TCCACGAGAT GCTGTACGGC 
TATCTGCCCG CGGTGATCAC CGGCTTCCTG CTCACCGCGA TCCCGAACTG GACCGGCCGG 
CTGCCGCTGC AGGGCAGGCC GTTGCTGGTG CTGGTGCTGA CTTGGCTCGC CGGGCGGCTG 
TGCGTGACGT TCTCGGCCGA TACCGGCTGG CTGGCCGCGA TGCTGGTCGA TGCGAGCTTC 
ATGGCGCTGG TTGCGCTCGC TGCCGCGCGC GAAATCGCCG CCGGGAAGAA CTGGAGCAAC 
CTCAACGTCG TCGCGCTGCT CACGCTGCTG CTCGCCGGCA ACATCGCCTT TCATCTCGAG 
GCGCATGTCA ACGGCACCGC CGATTACGGC ATCCGCGCCG GCATCGGCGT GGTGATCCTG 
CTGATCTCGC TGATCGGCGG ACGGATCACG CCGAGCTTCA CCCGCAACTG GCTGGTGCGC 
GAGAATCCCG GCCGGCTGCC GGTTCCGTTC AACAAGCTCG ACATCGCGAT CGTCGCCTTC 
AGCGCCGCGA CGCTGATCCT CTGGACCGTG TTGCCGATCA GCATGGTGAC CGGCACGGCG 
CTGGCGCTGG CGGGCGTGGC GCATCTGGTG CGGCTGGCGC GCTGGGCCGG CGATCGCACG 
CTGCGGGATC GGCTGCTGCT GGTGTTGCAT GTCGGCTATC TGTTCGTGCC GCTCGGCTTC 
CTGCTCACCG CCTGCGCGGC GTTCGGGCTG GTTCCGCCCA GCGCCGGCAT GCACGCCTGG 
ATGGTCGGCG GCGCCGGCAT CATGACGCTG GCGGTGATGA CCCGCGCCTC GCTCGGCCAT 
ACCGGGCAGG AATTGCGGGC GTCGCTGCCG ACCCAGGCGG TCTATCTCGC CGCCCTGGTC 
GCCGTGATGG CACGCGTCGG CGCGGCGCTG CTGCCGTCGT GGAGCGATCC GTTGCTGCAT 
CTCTCGGTGC TGGGCTGGTC GGTCGCCTTC CTCGGCTTCG CGCTGAGCTA CGGCCCGACG 
CTGCTGGCCC GTAGCAAGCC GCATTGA

Protein sequence

MSSTTIDPSA SGPAKRKPVP RYREQGGLTL LSAGFRPFFF FGAVFAAVAV LLWLPVYYGD 
LTLQTAFAPR DWHVHEMLYG YLPAVITGFL LTAIPNWTGR LPLQGRPLLV LVLTWLAGRL 
CVTFSADTGW LAAMLVDASF MALVALAAAR EIAAGKNWSN LNVVALLTLL LAGNIAFHLE 
AHVNGTADYG IRAGIGVVIL LISLIGGRIT PSFTRNWLVR ENPGRLPVPF NKLDIAIVAF 
SAATLILWTV LPISMVTGTA LALAGVAHLV RLARWAGDRT LRDRLLLVLH VGYLFVPLGF 
LLTACAAFGL VPPSAGMHAW MVGGAGIMTL AVMTRASLGH TGQELRASLP TQAVYLAALV 
AVMARVGAAL LPSWSDPLLH LSVLGWSVAF LGFALSYGPT LLARSKPH