Gene Sala_0979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0979
Symbol
ID	4079978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1003132
End bp	1005141
Gene Length	2010 bp
Protein Length	669 aa
Translation table	11
GC content	61%
IMG OID	638009339
Product	RNA polymerase sigma factor RpoD
Protein accession	YP_616029
Protein GI	103486468
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0235491
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACGA AGAACGAAGC CGATACCGAC GCCCCGCTGA TCGACCTGAA CGAGGCCGAC 
GTCAAAAAAC TGATCGCGCG CGGCAAGAAG CGCGGTTACC TGACCTATGA CGAGCTCAAT 
GCGGCGCTGC CGCAGGACGA AATGTCGTCC GAGCAGATCG AGGATATCAT GTCGGCCATC 
TCCGACATGG GCATCAACAT CGTCGAAAGC GACGAGGATG TGCAGGAAGA GGCCGAGCAG 
GAGGTCGACG ACGAGGTCGA TGTTTCGGCA GGCACCGGGT CGGTTTCGAA CCCCGCGATC 
GAAAAGAAGA AGGAAACGGT CGATCGCACC GACGATCCCG TGCGCATGTA TCTGCGCGAA 
ATGGGTGCGG TCGAATTGCT GTCCCGCGAG GGTGAAATCG CGATCGCGAA GCGCATCGAG 
GCGGGCCGCG ACACGATGAT CCTCGGGCTT TGCGAAAGCC CGCTGACCTT CAACGCGATC 
ATCGAATGGT CGAACGCGCT CAACAATGGC GACATGCAGC TGCGCGAGAT CGTCGACCTC 
GAAGCGATGC TGTCGAAAGA TCCGGCGCCT GAAAATCTCG ACGAGGAAGG CGCCGAGGAC 
GGCGAGATCA GCGAAAAGAC CGCCGGCGTC TCGTTCAAGG ACGAGGATGA GGTCGAGGAA 
GAGCCTGCCG CCGACGGCGA CGACGAGGAT GGCGAAGGCA CATCGGGCAA GCGTGAAAGC 
TTCGACGACG ATGACGAGGA CAATACGCTG AGCCTCGCCG CGATGGAGGA ATTGCTCAAG 
CCCGACGCGC TTGAGAAGTT CGCGAACATT ACCAAAAGCT TCAAGGCGTT CCAGAAGCTT 
CAGGAAGCCC GGCTCGAAGC GCTGTCGAGT GGCGAGGAGT TTCCGGCGGC GTCGGAAAAG 
AAATATCACA AGCTGCGCGA GGAACTCACC GCACAGGTCG AGAGCGTGCA GTTCCATGGC 
ACCAAGATCG AATATCTGGT CGACCAGCTC TACAGCTACA ACCGCCGCCT GACCGCGCTC 
GGCGGCCAGA TGCTGCGCCT TGCCGAGCGT CACAAGGTCC CGCGCAAGTC GTTCCTCGAC 
CATTATGTCG GCCGCGAGCT CGAAGAAAAC TGGCTTGAGG AAGTCGCCGG CATCGACAAG 
AAATGGGCGG CGTTCGCCGA GAATGAGGCC GCCGCGGTCG ATCGCATCCG CGTCGAGATC 
AGCGAGATCG CGCAGGCCGC GGGCATGAGC CTGACCGAGT TCCGCCGCGT CGTGAACATG 
GTGCAGAAGG GCGAGCGCGA GGCGCGCATC GCCAAGAAGG AAATGGTCGA GGCCAACCTG 
CGCCTCGTCA TTTCGATCGC CAAGAAGTAC ACGAACCGCG GGCTGCAGTT CCTCGACCTC 
ATTCAGGAAG GGAACATCGG CCTGATGAAG GCGGTCGACA AGTTCGAATA TCGCCGCGGC 
TACAAGTTCA GCACCTATGC GACCTGGTGG ATCCGCCAGG CGATCACCCG CTCGATCGCC 
GATCAGGCGC GTACGATCCG TATCCCCGTC CATATGATCG AGACGATCAA CAAGCTGGTG 
CGCTGCAGCC GCCAGTTCCT CCACGAAAGC GGCCGCGAGC CGACCCCGGA GGAAATGGCC 
GAGCGGCTGT CGATGCCGCT CGAAAAGGTC CGCAAGGTGA TGAAGATCGC CAAGGAGCCG 
ATCAGCCTCG AAACGCCGAT CGGCGACGAG GAAGACAGCC ACCTCGGCGA TTTCATCGAG 
GACAAGAATG CGGTGATACC GGTCGATGCC GCGGTGCAGT CGAACCTCAA GGAAACCGTC 
ACCCGCGTCC TTGCATCGCT CACCCCGCGC GAGGAACGCG TGCTGCGTAT GCGCTTCGGC 
ATCGGCATGA ACACCGACCA TACGCTCGAA GAAGTGGGTC AGCAGTTCAG CGTGACCCGC 
GAACGCATCC GCCAGATCGA GGCAAAAGCC CTCCGCAAGC TCAAGCACCC GTCGCGGTCG 
CGCAAGATGC GGTCGTTCCT TGACCAGTAG

Protein sequence

MATKNEADTD APLIDLNEAD VKKLIARGKK RGYLTYDELN AALPQDEMSS EQIEDIMSAI 
SDMGINIVES DEDVQEEAEQ EVDDEVDVSA GTGSVSNPAI EKKKETVDRT DDPVRMYLRE 
MGAVELLSRE GEIAIAKRIE AGRDTMILGL CESPLTFNAI IEWSNALNNG DMQLREIVDL 
EAMLSKDPAP ENLDEEGAED GEISEKTAGV SFKDEDEVEE EPAADGDDED GEGTSGKRES 
FDDDDEDNTL SLAAMEELLK PDALEKFANI TKSFKAFQKL QEARLEALSS GEEFPAASEK 
KYHKLREELT AQVESVQFHG TKIEYLVDQL YSYNRRLTAL GGQMLRLAER HKVPRKSFLD 
HYVGRELEEN WLEEVAGIDK KWAAFAENEA AAVDRIRVEI SEIAQAAGMS LTEFRRVVNM 
VQKGEREARI AKKEMVEANL RLVISIAKKY TNRGLQFLDL IQEGNIGLMK AVDKFEYRRG 
YKFSTYATWW IRQAITRSIA DQARTIRIPV HMIETINKLV RCSRQFLHES GREPTPEEMA 
ERLSMPLEKV RKVMKIAKEP ISLETPIGDE EDSHLGDFIE DKNAVIPVDA AVQSNLKETV 
TRVLASLTPR EERVLRMRFG IGMNTDHTLE EVGQQFSVTR ERIRQIEAKA LRKLKHPSRS 
RKMRSFLDQ