Gene RPC_3424 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3424
Symbol
ID	3970179
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	3810682
End bp	3811701
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	62%
IMG OID	637926535
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_533283
Protein GI	90424913
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.127359
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGATCC AGAAAAATTG GCAAGAACTG ATTCGGCCGA ACAAGCTCGT GGTCACGCCG 
GGCTCCGACC CGACGCGTTT TGCGACCCTC GTTGCCGAAC CGCTCGAGCG CGGCTTCGGC 
CAGACGCTGG GCAACGCGCT GCGGCGCGTG CTGCTGTCAT CGCTGCAGGG TGCCGCGGTG 
CAGTCGGTTC ATATCGACGG CGTGCTGCAT GAGTTCTCCT CGATCGCCGG CGTGCGCGAA 
GACGTTACCG ACATCGTGCT GAACATTAAG GACATCTCGA TCAAGATGCA GGGCGAAGGC 
CCGAAGCGCA TGGTCGTGAA GAAGCAGGGT CCCGGCACCG TCACCGCCGG CGACATCCAG 
ACCGTCGGCG ACGTCGTGGT GCTCAATCCG GACTTGCAGA TCTGCACGCT GGACGAGGGC 
GCCGAGATCC GCATGGAATT CACCGTGGCC GGCGGCAAGG GCTACGTCGC CGCCGAGCGC 
AACCGTCCCG AGGACGCGCC GATCGGCCTG ATCCCGGTCG ACAGCCTGTT CTCCCCGGTG 
CGCAAGGTCT CCTACAAGGT CGAGAACACC CGCGAGGGCC AGATCCTCGA CTACGACAAA 
TTGACCATGA CGATCGAGAC CAACGGCGCG ATCTCGCCGG ACGACGCGGT GGCCTATGCC 
GCCCGCATCC TGCAGGATCA GCTCAACGTG TTCGTCAACT TCGAAGAGCC GCGCAAGGAA 
GTCACCCAGG AGATCATCCC GGATCTGGCG TTCAACCCGG CGTTCCTCAA GAAGGTCGAC 
GAGTTGGAGT TGTCGGTGCG TTCGGCGAAC TGCCTGAAGA ACGATAACAT CGTCTATATC 
GGCGACCTGG TGCAGAAGTC GGAAGCGGAA ATGCTGCGCA CCCCGAACTT CGGCCGCAAG 
TCGCTCAACG AGATCAAGGA AGTGCTGGCC CAGATGGGTC TGCATCTCGG CATGGAAGTG 
CCGGGCTGGC CGCCGGAAAA CATCGACGAA TTGGCCAAGC GCTTCGAGGA TCATTACTGA

Protein sequence

MTIQKNWQEL IRPNKLVVTP GSDPTRFATL VAEPLERGFG QTLGNALRRV LLSSLQGAAV 
QSVHIDGVLH EFSSIAGVRE DVTDIVLNIK DISIKMQGEG PKRMVVKKQG PGTVTAGDIQ 
TVGDVVVLNP DLQICTLDEG AEIRMEFTVA GGKGYVAAER NRPEDAPIGL IPVDSLFSPV 
RKVSYKVENT REGQILDYDK LTMTIETNGA ISPDDAVAYA ARILQDQLNV FVNFEEPRKE 
VTQEIIPDLA FNPAFLKKVD ELELSVRSAN CLKNDNIVYI GDLVQKSEAE MLRTPNFGRK 
SLNEIKEVLA QMGLHLGMEV PGWPPENIDE LAKRFEDHY