Gene SbBS512_E3681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3681
Symbol	rpoA
ID	6271128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3422043
End bp	3423032
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	52%
IMG OID	641727545
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_001881980
Protein GI	187731728
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.214877
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGGTT CTGTGACAGA GTTTCTAAAA CCGCGCCTGG TTGATATCGA GCAAGTGAGT 
TCGACGCACG CCAAGGTGAC CCTTGAGCCT TTAGAGCGTG GCTTTGGCCA TACTCTGGGT 
AACGCACTGC GCCGTATTCT GCTCTCATCG ATGCCGGGTT GCGCGGTGAC CGAGGTTGAG 
ATTGATGGTG TACTACATGA GTACAGCACC AAAGAAGGCG TTCAGGAAGA TATCCTGGAA 
ATCCTGCTCA ACCTGAAAGG GCTGGCGGTG AGAGTTCAGG GCAAAGATGA AGTTATTCTT 
ACCTTGAATA AATCTGGCAT TGGCCCTGTG ACTGCAGCCG ATATCACCCA CGACGGTGAT 
GTCGAAATCG TCAAGCCGCA GCACGTGATC TGCCACCTGA CCGATGAGAA CGCGTCTATT 
AGCATGCGTA TCAAAGTTCA GCGCGGTCGT GGTTATGTGC CGGCTTCTAC CCGAATTCAT 
TCGGAAGAAG ATGAGCGCCC AATCGGCCGT CTGCTGGTCG ACGCATGCTA CAGCCCTGTG 
GAGCGTATTG CCTACAATGT TGAAGCAGCG CGTGTAGAAC AGCGTACCGA CCTGGACAAG 
CTGGTCATCG AAATGGAAAC CAACGGCACA ATCGATCCTG AAGAGGCGAT TCGTCGTGCG 
GCAACCATTC TGGCTGAACA ACTGGAAGCT TTCGTTGACT TACGTGATGT ACGTCAGCCT 
GAAGTGAAAG AAGAGAAACC AGAGTTCGAT CCGATCCTGC TGCGCCCTGT TGACGATCTG 
GAATTGACTG TCCGCTCTGC TAACTGCCTT AAAGCAGAAG CTATCCACTA TATCGGTGAT 
CTGGTACAAC GTACCGAGGT TGAGCTCCTT AAAACGCCTA ACCTTGGTAA AAAATCTCTT 
ACTGAGATTA AAGACGTGCT GGCTTCCCGT GGACTGTCTC TGGGCATGCG CCTGGAAAAC 
TGGCCACCGG CAAGCATCGC TGACGAGTAA

Protein sequence

MQGSVTEFLK PRLVDIEQVS STHAKVTLEP LERGFGHTLG NALRRILLSS MPGCAVTEVE 
IDGVLHEYST KEGVQEDILE ILLNLKGLAV RVQGKDEVIL TLNKSGIGPV TAADITHDGD 
VEIVKPQHVI CHLTDENASI SMRIKVQRGR GYVPASTRIH SEEDERPIGR LLVDACYSPV 
ERIAYNVEAA RVEQRTDLDK LVIEMETNGT IDPEEAIRRA ATILAEQLEA FVDLRDVRQP 
EVKEEKPEFD PILLRPVDDL ELTVRSANCL KAEAIHYIGD LVQRTEVELL KTPNLGKKSL 
TEIKDVLASR GLSLGMRLEN WPPASIADE