Gene BBta_5046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_5046
Symbol	rpoA
ID	5149761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	5275178
End bp	5276209
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	63%
IMG OID	640559824
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_001240953
Protein GI	148256368
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0408631
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.958591
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGAAA CAGTGACGAT CCAGAAGAAT TGGCAAGAAT TGATTCGGCC GAACAAGCTC 
CAGGTCACGC CGGGCTCCGA CGCGACCCGT TTCGCCACCG TGGTTGCCGA GCCGCTGGAG 
CGCGGTTTCG GCCAGACGCT GGGCAATGCG CTCCGCCGCA TCCTGCTGTC GTCGCTGCAG 
GGCGCCGCAG TGCAGTCGGT GCACATCGAT GGCGTGCTGC ACGAGTTCTC CTCGATCGCG 
GGCGTCCGTG AGGACGTCAC CGACATCGTG CTGAACATCA AGGATATCTC GATCAAGATG 
CAGGGCGAGG GCCCGAAGCG GATGGTCGTG AAGAAGCAGG GTCCGGGCGC CGTCACCGCC 
GGCGATATCC AGACCGTCGG CGACATCGTC GTGCTCAATC CCGACCTGCA GCTCTGCACC 
CTGGACGAGG GCGCCGAGAT CCGCATGGAG TTCACGGTCG CGACCGGCAA GGGCTACGTG 
CCGGCCGAGC GCAACCGTCC TGAGGACGCG CCGATCGGCC TGATCCCGAT CGACAGCCTG 
TTCTCGCCGG TCCGCAAGGT CTCCTACAAG GTCGAGAACA CCCGCGAGGG CCAGATCCTC 
GACTACGACA AGCTGACCAT GACGATCGAG ACCAACGGCG CGATCTCGCC GGAGGACGCG 
GTGGCCTACG CCGCTCGCAT CCTGCAGGAT CAGCTCAACG TCTTCGTCAA CTTCGAAGAG 
CCGCGCAAGG AAGTTGCCCA GGAGATCATT CCGGATCTCG CCTTCAATCC GGCGTTCCTC 
AAGAAGGTGG ACGAACTCGA GCTGTCGGTG CGTTCGGCGA ACTGCCTGAA GAACGACAAC 
ATCGTCTATA TCGGCGACCT CGTGCAGAAG TCGGAAGCGG AGATGCTGCG CACCCCGAAC 
TTCGGCCGCA AGTCGCTGAA CGAGATCAAG GAAGTGCTGG CTCAGATGGG TCTGCATCTC 
GGCATGGAAG TGCCTGGCTG GCCGCCGGAG AATATCGACG AACTGGCCAA GCGCTTCGAG 
GATCACTACT GA

Protein sequence

MGETVTIQKN WQELIRPNKL QVTPGSDATR FATVVAEPLE RGFGQTLGNA LRRILLSSLQ 
GAAVQSVHID GVLHEFSSIA GVREDVTDIV LNIKDISIKM QGEGPKRMVV KKQGPGAVTA 
GDIQTVGDIV VLNPDLQLCT LDEGAEIRME FTVATGKGYV PAERNRPEDA PIGLIPIDSL 
FSPVRKVSYK VENTREGQIL DYDKLTMTIE TNGAISPEDA VAYAARILQD QLNVFVNFEE 
PRKEVAQEII PDLAFNPAFL KKVDELELSV RSANCLKNDN IVYIGDLVQK SEAEMLRTPN 
FGRKSLNEIK EVLAQMGLHL GMEVPGWPPE NIDELAKRFE DHY