Gene RPD_3160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3160
Symbol
ID	4023665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3512678
End bp	3513697
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	63%
IMG OID	637963361
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_570287
Protein GI	91977628
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.277203
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.200349
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGATCC AGAAAAATTG GCAAGAACTG ATTCGACCGA ACAAGCTTCA GGTTTCGCCG 
GGCAGTGATG CGACGCGGTT CGCGACGCTG GTCGCCGAGC CGCTCGAGCG CGGCTTCGGC 
CAGACGCTGG GCAACGCGCT GCGGCGCGTG TTGCTGTCCT CGCTGCAGGG CGCTGCGGTG 
CAGTCGGTGC AGATCGACGG CGTGCTGCAC GAGTTCTCCT CGATTGCCGG CGTGCGCGAG 
GACGTCACCG ACATCGTGCT GAACATCAAG GACATCTCGC TGAAGATGCA GGGCGAAGGC 
CCGAAGCGGA TGGTCGTCAA GAAGCAGGGT CCGGGCGTCG TCACCGCCGG CGACATCCAG 
ACCGTCGGCG ATATCGTCGT GCTGAACCCC GACCTGCAGA TCTGCACCCT GGACGAGGGC 
GCGGAGATCC GCATGGAGTT CACCGTCAAC ACCGGCAAGG GCTACGTCGC CGCCGAGCGT 
AACCGTCCCG AGGACGCGCC GATCGGCCTG ATCCCGGTCG ACAGCCTGTA CTCGCCGGTT 
CGCAAGGTGT CGTACAAGGT CGAGAACACC CGCGAGGGCC AGATCCTCGA CTACGACAAG 
CTGACCATGA CGGTCGAGAC CAACGGCGCG CTGACGCCGG ATGACGCGGT GGCCTTCGCC 
GCCCGCATCC TGCAGGATCA GCTCAACGTC TTCGTCAACT TCGAAGAGCC GCGCAAGGAA 
GTCACCCAGG AGATCATTCC GGATCTCGCC TTCAACCCGG CTTTCCTCAA GAAGGTGGAC 
GAGCTCGAGC TGTCGGTGCG TTCGGCGAAC TGCCTGAAGA ACGACAACAT CGTCTATATC 
GGCGATCTGG TGCAGAAGTC GGAAGCAGAG ATGCTGCGCA CTCCGAACTT CGGCCGCAAG 
TCGCTGAACG AGATCAAGGA AGTGCTGGCG CAGATGGGCC TGCATCTCGG CATGGAAGTG 
CCGGGCTGGC CGCCGGAGAA CATCGACGAG CTCGCCAAGC GTTTCGAAGA TCACTACTGA

Protein sequence

MTIQKNWQEL IRPNKLQVSP GSDATRFATL VAEPLERGFG QTLGNALRRV LLSSLQGAAV 
QSVQIDGVLH EFSSIAGVRE DVTDIVLNIK DISLKMQGEG PKRMVVKKQG PGVVTAGDIQ 
TVGDIVVLNP DLQICTLDEG AEIRMEFTVN TGKGYVAAER NRPEDAPIGL IPVDSLYSPV 
RKVSYKVENT REGQILDYDK LTMTVETNGA LTPDDAVAFA ARILQDQLNV FVNFEEPRKE 
VTQEIIPDLA FNPAFLKKVD ELELSVRSAN CLKNDNIVYI GDLVQKSEAE MLRTPNFGRK 
SLNEIKEVLA QMGLHLGMEV PGWPPENIDE LAKRFEDHY