Gene RPB_1761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1761
Symbol
ID	3909748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	2014928
End bp	2016088
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	69%
IMG OID	637883655
Product	nitrate transporter component, nrtA
Protein accession	YP_485380
Protein GI	86748884
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.786473
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0141893
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGC GCCTGCGCAT CGGATTCATC CCGCTGGCCG ACGCCGCGGC GCTGATCGTC 
GCCGTCGACA AGGGGTTCTG CGCCACCGAG GGGCTCGACG TCGAGCTGGT GCGCGAAATC 
TCCTGGGCCA ATGTCCGCGA CAAATTCAAC ATCGGCCTAT TCGACGCCGC GCATCTGTTG 
GCGCCGATGG CGGTCGCCTC CAGCCTCGGC ATCGGCCACA TCAAGGTGCC GGTGATTTCC 
GGCTTCGGCC TCGGCGTCAA CGGCAACGCC ATCACGGTGT CGCCGGATCT GCAGGCTGCG 
ATCGCGGCGA TGGCCGAGGG CGACGTCGCC GATCCGCTGG TGTCGGCGCG GGCGCTGGCG 
CGCGTCGTCG CCGAGCGCAA GGCGCTGGGG CTGGAGCCGC TGATCTTCGG CATGACCTTC 
CCGTTCTCCA GCCACAATTA CGATCTGCGG TTCTGGATGG GCGCTGGCGG GGTCGATCCC 
GACGAAGACG TCCGCCTCGT GGTGCTGCCG CCGCCCTACA TGGTCGAGAG CCTCGCCAAC 
AAACATCTCG ACGGCTTCTG CGTCGGCGCG CCGTGGAATT CGGTGGCGAT CGATCTCGGC 
ATCGGCCACA TCCTGCATTT CTCCTGCGAG CTGTTCCAGC GCGCCGCGGA GAAGATGCTG 
GCGGTGCGCG CCTCATGGGC CGAAGGACAT CCGGAGACGC TGGCGCGGCT GATCCGGGCG 
CACGATCGCG CCGCGCAATT CATCGAGCAC GAACCCAATC GCGACGAGGT CTGCGCGATT 
CTCACCGCGC CGGGCCGGAT CGAAGTGACG CCGGAGCTGA TCCGCCGCAC CCTGGACGGC 
CGCCTCAAAG TCTCGCCCGA AGGCCGCATC CGCGAGACCG GCCGCTATCT GCTGGTCGGC 
CGCGAAGCCG CGGCACGGCC CGATCCGGTG CAGGGCGCGT GGAACTACGC GCAGATGGTG 
CGCTGGGGCC AGGCGCCGCT GTCGGCCGAA CTGCTCGCCG CCGCCAAGGC TGTGTTCCGG 
CCCGACCTCT ACGACGCCGC CGTCGGCACG CCGCCGATCC TGCCGATCGC GCCCGCCGAC 
GGCATCGGCG AATGCACCGG CACGCATTTC GATCCGGACG ACATCGCCGG CTATCTGTCG 
GCGCTGACGA TCCGGCGCTG A

Protein sequence

MSERLRIGFI PLADAAALIV AVDKGFCATE GLDVELVREI SWANVRDKFN IGLFDAAHLL 
APMAVASSLG IGHIKVPVIS GFGLGVNGNA ITVSPDLQAA IAAMAEGDVA DPLVSARALA 
RVVAERKALG LEPLIFGMTF PFSSHNYDLR FWMGAGGVDP DEDVRLVVLP PPYMVESLAN 
KHLDGFCVGA PWNSVAIDLG IGHILHFSCE LFQRAAEKML AVRASWAEGH PETLARLIRA 
HDRAAQFIEH EPNRDEVCAI LTAPGRIEVT PELIRRTLDG RLKVSPEGRI RETGRYLLVG 
REAAARPDPV QGAWNYAQMV RWGQAPLSAE LLAAAKAVFR PDLYDAAVGT PPILPIAPAD 
GIGECTGTHF DPDDIAGYLS ALTIRR