Gene RPB_1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1940
Symbol
ID	3908019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	2208359
End bp	2209441
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	67%
IMG OID	637883834
Product	hypothetical protein
Protein accession	YP_485559
Protein GI	86749063
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.310986
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCGCC ACAGGTCCGG CTTTCGGCGG CGGTTGTTTG GCGGTAGGCT GGCAACCATG 
ATGTGGGGAT TAGCGGTGCT GCGCAAAGCT TTCATGAGAG TGTTCTCGGC CCATCCGGTC 
GAGACCATCG CCGCCTGCAC CGGTCTGTTC ATGATCGTGC TCGGCTTCGC GCTCGGCACC 
CAGACCGGCT GGGTCTGGTT CTGGGGCCAG GTCTCGGCGA TCTGCGGCGC CAGCCTCACC 
ACCCTCGCCA TCGTGTGGAC GGTGCGCCAG CGCGCCGCCG AAGCGCGCAC CGCCGCCCAT 
CTCAACGTGC TGGCGCGCCA GCTCGAGACC TCGATCAGCC AGATCCACAA ATCGGTCAAG 
GGTGGCCGCG ACGAGTCGCT GCCCTCCGCG GTGTATCTCG CCCAGATCGA ACAGTGCATC 
GACAATCTGA TCGGCGTCAC CCACGAGATC GGTGAGATCA CCGGCCGGCA ATTGCCGTTC 
GACGTGATCG AGATGCTGAC CGCACGCGAC ACGCTGCATA TCGAGGCGCA TATCACCGAC 
GCCCGCGCCC CGGAGCGCAA GCTCGCCACC GAGACCGAGA ACTGCCCGGC CTGCAAGAAG 
CCGGTCGAAT TCCAGATCGG CAGCCTCCCC GGCGACAGCG CCAAGCCGAC CTGCCAGCAT 
TGCGGCCAGC GCTTCCACGC CCACCGCTCG ACCACCGGCG GCATTTTCCT GCGGATGCCC 
GGCGCCTCGC AATTCACCCG CGCGGTGTCG GTGAGCTGCC CGGTCTGCGC CAGCAAGATC 
CCGGCGAATA TCGACCAGGG CAAGCAGCAT TCGGAGACGC GGTTCTGCTT CTCTTGCGGC 
GCCAAGGTCT CGATCGATCC GCTCGGGCAG GAATGCACGC TGATCAGCAA GCAGGACCGC 
CTGCCCGGCC ATTTCAACGC CGCCGGCAGC CTGGTGTGCG AGACCTGCAG CGAGCCGGCG 
ATCGTGCTGA CCTCGAACAG CGCCGGCACC TACGGCATCT GCCGCAAGGA CGACGGCCTG 
GTGTTCCTGC CCGCAAGCAG CGCTCCGGCC GCGGCACCGT CGCGCAGCGA CGCGGCCGAG 
TAG

Protein sequence

MLRHRSGFRR RLFGGRLATM MWGLAVLRKA FMRVFSAHPV ETIAACTGLF MIVLGFALGT 
QTGWVWFWGQ VSAICGASLT TLAIVWTVRQ RAAEARTAAH LNVLARQLET SISQIHKSVK 
GGRDESLPSA VYLAQIEQCI DNLIGVTHEI GEITGRQLPF DVIEMLTARD TLHIEAHITD 
ARAPERKLAT ETENCPACKK PVEFQIGSLP GDSAKPTCQH CGQRFHAHRS TTGGIFLRMP 
GASQFTRAVS VSCPVCASKI PANIDQGKQH SETRFCFSCG AKVSIDPLGQ ECTLISKQDR 
LPGHFNAAGS LVCETCSEPA IVLTSNSAGT YGICRKDDGL VFLPASSAPA AAPSRSDAAE