Gene RSP_3606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3606
Symbol
ID	3721764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007494
Strand	+
Start bp	701300
End bp	702598
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	73%
IMG OID	640073273
Product	Sigma54-2 (RNA polymerase sigma-54 factor)
Protein accession	YP_355111
Protein GI	77465608
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTCCC GCCAGCGCAT CAGTATCGCC CAGACCCAGA GGCTGCAGCT CAATCTCGGC 
CTCACCGCCT CGATCCGCGT CCTGAATTCC GATGCCGAGG GCCTCACGCG CTACCTGCAG 
GAGCAGGCGG CGGAGAACCC CCATATCCAG CTCGAACCGG CAACCTCGAC CGACTGGCTG 
CCGCGCTGGA CGAGCGTTCT GTCGCGCCTC GCGCAGGGCG AGGGGTCGGC GGGCGGAGAG 
ACGGTGGCGG CGGCGGGGCC GAGCCTCATG GCGCATGTGA TGGCGCGCAT CGACACGCTT 
TATCCGCGCG GGCCCGAGCG GCGGATCGCC ATCCTTCTGG CCGAAGCGCT GGAGCCCACC 
GGCTGGCTCG GGACGGGACC GGACGAGATC GCCCGGCAGG CCCGCGTCCC CTCCGCCGAG 
GTCGAGGCCG TGCTGGCCGG GCTGCAGAAG ATCGAGCCCG CCGGCCTCTT CGCCCGAACC 
CTCGCCGAGT GCCTGCGGCT TCAGGCCATC GAGGCCGAGC GGCTCGATTC CACCCTGAGC 
TGCCTTCTCG ACCATCTCGA CCTGGTGGCA GAGGGGGCCC TCGGGCGGCT CGCGCGGCTC 
TGCAACACGG ACGAGGCCGG GGTGACCGCG CGCCTGCGGC TCCTGCGGAC CTTCGACCCG 
AAGCCCGGCG CGCAGTTCGA TCCGGGCGCG GCGCCGGTGC GCGAGCCCGA CCTGATCGCG 
ACGAAGGGCG AGGCCGGGTG GGAGGTGTCG CTGAACCGCT CGGCCATGCC CACGGTGCAG 
ATCCGCAAGC CGGACAAGCG CCCGACGACG CCGGCCGCCC GCGCGGCCTG GACCCAGGCG 
CAGGCGGTGG GCCGGATGAT CGAGAACCGC AATGCCACGC TGCTGAGGGT CGCGCGCGAG 
ATCCTCGCCC GGCAGGAGGC GGCGCTCGAC GAAGGTCCCT CGGCGCTCGT GGCCCTGACC 
ATGACCGAGG TGGCCGAGGC GCTCGGCATC CACGAGAGCA CGGTGAGCCG CGTGGTCGCG 
GGCACCTGCG TGGACACGCC GCGCGGCACC TGGTGGCTGC GGCGCATGTT CAGCGGCCGC 
CTTGCCGAGG GCGGTCCCTC GGCCGCGGCC ATCCGCGCCG CCATCGCCCG CCTCGTCGCG 
CAGGAAGATC CGGCCGCGCC TTTGTCCGAC GGCGCTCTGG TCGAGGCGCT GGCGGCCGAG 
GACATGCAGC TGGCGCGCCG CACCGTCGCC AAATATCGCG AGATGCTGAA CATCCCCCCC 
GGACACCGCC GCCGCCGCAG GCCCTCGCGC TCGGCCTGA

Protein sequence

MKSRQRISIA QTQRLQLNLG LTASIRVLNS DAEGLTRYLQ EQAAENPHIQ LEPATSTDWL 
PRWTSVLSRL AQGEGSAGGE TVAAAGPSLM AHVMARIDTL YPRGPERRIA ILLAEALEPT 
GWLGTGPDEI ARQARVPSAE VEAVLAGLQK IEPAGLFART LAECLRLQAI EAERLDSTLS 
CLLDHLDLVA EGALGRLARL CNTDEAGVTA RLRLLRTFDP KPGAQFDPGA APVREPDLIA 
TKGEAGWEVS LNRSAMPTVQ IRKPDKRPTT PAARAAWTQA QAVGRMIENR NATLLRVARE 
ILARQEAALD EGPSALVALT MTEVAEALGI HESTVSRVVA GTCVDTPRGT WWLRRMFSGR 
LAEGGPSAAA IRAAIARLVA QEDPAAPLSD GALVEALAAE DMQLARRTVA KYREMLNIPP 
GHRRRRRPSR SA