Gene RPB_3430 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3430
Symbol
ID	3911232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3927961
End bp	3929493
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	65%
IMG OID	637885333
Product	hypothetical protein
Protein accession	YP_487037
Protein GI	86750541
COG category	[S] Function unknown
COG ID	[COG3333] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.467097
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0598189
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGAGC TCACCAACCT GTTCCACGGC TTCGCCGTCG CGCTGATGCC GTTCAACATC 
CTGGTGATGG TGATCGGCAT CGTACTCGGC GTCATTATTG GCGTGCTGCC GGGCCTCGGC 
GGCGCCAACG GCGTCGCGAT CCTGCTGCCG CTGACCTTCA GCATGCCGCC GACCTCGGCG 
ATCATCATGC TGTCCTGCAT CTATTGGGGC GCGCTGTTCG GCGGGGCGAT CACCTCGATC 
CTGTTCAACA TCCCCGGCGA ACCATGGTCG GTCGCGACCA CCTTCGACGG CTATCCGATG 
GCGCAGCAGG GCAAGGCCGG CGAAGCGCTG ACCGCCGCCT TCACCTCGTC CTTCGTCGGT 
GCGCTGTTCG CGATCATCAT GATCACGCTG GTCGCGCCGC TGGTGGCGCG GTTCGCGCTG 
GAGTTCGGCC CGGCCGAAAA ATTCGCGGTG TACTTCCTCG CCTTCTGCAG TTTCATCGGG 
CTGTCGAAGG AACCAGCATT CAAGACGGTC GCGGCGATGA TGCTCGGCTT CGCGCTGGCC 
GCGGTGGGGC TGGATTCGAT GACCGGCCAG CTCCGGCTGA CCTTCGGCTT CACCGAAATG 
CTGAACGGTT TCGACTTCCT GATCGCGGTG ATCGGCCTGT TCGGCATCGG CGAGATCCTG 
CTGACGATGG AGGACGGACT GAGCTTCCGC GGCAGCAAGG CCAAGATCAA TCTGCGCGTC 
GTGCTGCAGA CCTGGAAGGA ACTGCCGCGC TACTGGATGA CGTCGCTACG CTCCAGCGTG 
ATCGGCTGCT GGATGGGCAT CACGCCGGCC GGCGCCACGC CGGCCTCGTT CATGAGCTAC 
GGCATCGCCA AGCGGGTGTC GAAGAACGGC AAGAATTTCG GCCACGGCGA GATCGAAGGC 
GTGATCGCGC CGGAGACCGC GGCGCACGCC GCCGGCACCG CGGCGCTGCT GCCGATGCTG 
TCGCTCGGCG TGCCGGGATC GCCGACCGCA GCCGTGCTGC TCGGCGGCCT GCTGATCTGG 
GGTCTGCAGC CCGGCCCGAT GCTGTTCGTC GAGCAGAAGG AATTCGTCTG GGGCCTGATC 
GCCTCGATGT ATCTCGGCAA CATCGTCGGC CTCTTGATCG TGCTGACCTG CGTGCCGTTC 
TTCGCCGCGA TCCTGCGGAT TCCGTTCAGC ATCGTCGCGC CGCTGATCCT GGTGCTGTGC 
GCGATCGGCG CCTATTCGGT GCACAACTCG ACCTTCGACG TGATGCTGAT GCTGGTGTTC 
GGCGTGATCG GCTATCTGCT GAAGAAGTGC AATTATCCGC TGGCGCCGCT GGTGCTGGCG 
ATCGTGCTCG GCGACAAGGC GGAGGAAGCG TTCCGGCAGT CGCTGCTGGC CTCGCAGGGT 
GCGCTCGGCG TGTTTTTCTC CAACGGGCTG GTCGGCACGA TCATGGCGCT CGGGCTGATC 
GCGCTGTTCT GGTCGCCGCT CAACGCCGGC TATGCCCGAC TGCGATCCGC GGCGACCGGG 
CGGCCGCGGC CGGCCGGCCC CGGTTACGAA TAG

Protein sequence

MEELTNLFHG FAVALMPFNI LVMVIGIVLG VIIGVLPGLG GANGVAILLP LTFSMPPTSA 
IIMLSCIYWG ALFGGAITSI LFNIPGEPWS VATTFDGYPM AQQGKAGEAL TAAFTSSFVG 
ALFAIIMITL VAPLVARFAL EFGPAEKFAV YFLAFCSFIG LSKEPAFKTV AAMMLGFALA 
AVGLDSMTGQ LRLTFGFTEM LNGFDFLIAV IGLFGIGEIL LTMEDGLSFR GSKAKINLRV 
VLQTWKELPR YWMTSLRSSV IGCWMGITPA GATPASFMSY GIAKRVSKNG KNFGHGEIEG 
VIAPETAAHA AGTAALLPML SLGVPGSPTA AVLLGGLLIW GLQPGPMLFV EQKEFVWGLI 
ASMYLGNIVG LLIVLTCVPF FAAILRIPFS IVAPLILVLC AIGAYSVHNS TFDVMLMLVF 
GVIGYLLKKC NYPLAPLVLA IVLGDKAEEA FRQSLLASQG ALGVFFSNGL VGTIMALGLI 
ALFWSPLNAG YARLRSAATG RPRPAGPGYE