Gene Sala_1483 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1483
Symbol
ID	4081255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1540612
End bp	1541913
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	70%
IMG OID	638009848
Product	RNA polymerase ECF-subfamily sigma factor
Protein accession	YP_616529
Protein GI	103486968
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.860065
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGCCT CGTCGGTGAA CTTCGCGGAC AAGACGGACA TGGCAATGGA AGACATCCAT 
AGGGCAATCG AGGCGGTTTT CCGCATCGAG CGGGCGAGGT TGATTGCCGG TCTTGCCCGC 
CTGACCCGCG ACGTCGACCG CGCCGAGGAA CTGGCGCAGG ATGCGCTGCT CGTCGCGCTG 
ACCGAGTGGC CGAGGGGCGG CGTTCCGGAC AATCCCGGCG CGTGGCTCAT GACTGCGGCG 
AAGCGGCGCG CGATCGACGG CGTTCGCCAC CATGCGATGC GGACGCGCAA ACATGCCGAG 
ATTGCCCGCG AACTGGACGA GGAGCGCGAC ATGAGCGCGG AGGCCGTCGA AGCGGCGCTG 
GACGATCCGC TGGGCGACGA ACTGCTCGGG CTGATCTTTG CCGCCTGCCA CCCCGTGATT 
TCGCCCGACG GACGCGCCGC GCTGACGCTA CGGCTCGTTG GCGGGCTGAC GGTCGAGGAG 
ATTGCGCGGG CTTTCCTGTC GAACGAGGCG ACGATCGCGG CGCGGATCAC CCGCGCCAAG 
AAAGCGATCG CCAAGGCGGG CGTGGCGTTC GAGGTGCCGC GCGGCGCCGA GCTGGCGGCG 
CGCCTGCCGT CGGTGCTGGA AGTCGTCTAT CTGATTTTCA ACGAAGGCTA TGCCGCCACC 
GCGGGACCGG CGCTGGTGCG GCCGCCGCTC TGCGCCGAGG CGCTGCGACT GGGGCGCATC 
CTCGCCGCGC TGATGCCCGA TGAGCCGGAA GTGCTGGGCC TGTTGGCGCT GATGGAGATT 
CAGGCGTCGC GACTGGCGGC GCGCGCCGGG CCGGACGGCA GGTTCGTGCC GCTGACCGAA 
CATAACCGGG CGCGCTGGGA CCAACTGCTC ATCCGCCGCG GGTTGAACGC GCTGGCGCGG 
GTCGAGGCGC TGGGAGGCGC GGGCGGACCC TATGCGTTGC AGGCGGCGCT CGCGGCCTGT 
CATGCCAGGG CGCGGCGCGC CGAGGACACC GACTGGCGGC GGATCGCCGC GCTTTATGAT 
CGGTTGGGAC AGGTGATGCC ATCGCCGGTG GTCGAACTCA ACCGGGCGAT CGCGCACAGC 
ATGGCGTTCG GTCCCGAAGC GGGGCTGGCG CTGGTTGATA CGCTCGCCGA CGCAGCGGTG 
CTCCGCAACT ATGCCCCGCT ACCCGCGGCG CGCGGCGATT TCCTGCTGCG CGCCGGTCGC 
AAAGCCGAGG CCAAAGGCGC GTTCGAGGCG GCGGCGGCGC TGTCGGCCAA TGAGCGTGAG 
CGCGAATGGC TGCTCGCACG GGCGGCCGCC TGCGCCAACT AG

Protein sequence

MLASSVNFAD KTDMAMEDIH RAIEAVFRIE RARLIAGLAR LTRDVDRAEE LAQDALLVAL 
TEWPRGGVPD NPGAWLMTAA KRRAIDGVRH HAMRTRKHAE IARELDEERD MSAEAVEAAL 
DDPLGDELLG LIFAACHPVI SPDGRAALTL RLVGGLTVEE IARAFLSNEA TIAARITRAK 
KAIAKAGVAF EVPRGAELAA RLPSVLEVVY LIFNEGYAAT AGPALVRPPL CAEALRLGRI 
LAALMPDEPE VLGLLALMEI QASRLAARAG PDGRFVPLTE HNRARWDQLL IRRGLNALAR 
VEALGGAGGP YALQAALAAC HARARRAEDT DWRRIAALYD RLGQVMPSPV VELNRAIAHS 
MAFGPEAGLA LVDTLADAAV LRNYAPLPAA RGDFLLRAGR KAEAKGAFEA AAALSANERE 
REWLLARAAA CAN