Gene RPB_3091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3091
Symbol
ID	3910892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3523359
End bp	3524447
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	64%
IMG OID	637884995
Product	hypothetical protein
Protein accession	YP_486700
Protein GI	86750204
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.972235
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCT CGAAGTCCGT GAAATCACCA TCAACTGGGT TGTTTGGGGA GGGAGCCGTG 
CCCGCTAGTT CCGGATCGAA CGCGCGCCTG TCACGCCGCA CACTGATCGG CGGCGCTCTC 
GCCGCTCCGT TTGTGCTGCG CAGCGGACGG GCGTTGGCCG ACGAACCCCT GTCGGTTCGC 
GTCGACTTCG CACCCTGGGG GGTGCACTCC GGTTTGCATC TGTCGAAAGC GAAGGGATGG 
TTCAAGGAAG ACGGCCTAAA CGTCGACCTG CAGGACGGAA CCGGCACGCT CAACACCATC 
AATCTGGTCG CCGCCGGCAA TGTCGATGTC GGACTGGTTC AGCTCGGGAT GCTGGCGATC 
GCGCGGTCGC AGGGACTGCC CGTCACGTCG TTCGCCGGCT TCCTGCGCAA GGGCGATCTC 
GCGACCTTGG TTGACGCCAA GGCCGGGCCG AAGACCCCGC AGGACCTCGC CGGCAAGAAG 
ATCGTCTGTT TCGCCAACAG CCCCTGGGCG CCGTTCGTCG ACGTGTACTT GAAGCGCATC 
GGCCTTTCGC GCGGCGAAGG ACCCGACAAG GTCAATGTCG TCATGGTGTC GCCGGCGGCG 
ATGGTTTCGA CCTATGCGTC GGGCGCGGCG GACGGCTTCA TGTCGCTCAA GGAATTCGGC 
GAGCCTTATG TCGAACAGGC CCGGCCTGCT CGCTCGCTGC TGGCGGCCGA TGTCGGCATC 
GCGTTTCCGA GCTACGGTCT GATCGCCACC GATGCGACGC TCGCGAAACG CAAGGATCTG 
CTCGCCAAGC TCGTCGCCAA TCAGCGTCGG GCCTGGGACT ACATCTTCGC GGACCCGTCC 
CACATCGACG AAGGCGTGCG CGCCATCATC GCCAACCGTC CGGACAAGCA GCTCAACTTC 
GACATCCTCA AGGGGCAGAC CGCACTCTGC AAGGAGTTCG TCGACACCGA AAACACCAAG 
GGCAAGCCGC TCGGCTGGCA GTCGCCTGCC GATTGGAAGG CCACGATCGC GATGATGGCG 
GAAGCCGGTC AGGCCAAGGC GGACGCCGAC GTCTCCGGAT TCTTCACCAA CGATCTGGTC 
GGGGCATGA

Protein sequence

MTISKSVKSP STGLFGEGAV PASSGSNARL SRRTLIGGAL AAPFVLRSGR ALADEPLSVR 
VDFAPWGVHS GLHLSKAKGW FKEDGLNVDL QDGTGTLNTI NLVAAGNVDV GLVQLGMLAI 
ARSQGLPVTS FAGFLRKGDL ATLVDAKAGP KTPQDLAGKK IVCFANSPWA PFVDVYLKRI 
GLSRGEGPDK VNVVMVSPAA MVSTYASGAA DGFMSLKEFG EPYVEQARPA RSLLAADVGI 
AFPSYGLIAT DATLAKRKDL LAKLVANQRR AWDYIFADPS HIDEGVRAII ANRPDKQLNF 
DILKGQTALC KEFVDTENTK GKPLGWQSPA DWKATIAMMA EAGQAKADAD VSGFFTNDLV 
GA