Gene Rxyl_0966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_0966
Symbol	sat
ID	4115929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	1003848
End bp	1005029
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	69%
IMG OID	638035751
Product	sulfate adenylyltransferase
Protein accession	YP_643745
Protein GI	108803808
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2046] ATP sulfurylase (sulfate adenylyltransferase)
TIGRFAM ID	[TIGR00339] ATP sulphurylase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.399094
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCGCA CGGAGTACAC CACCATAACC CCGCACGGCG GCACCCTCGT GGACCGGCGG 
GTGCCGGTGG GCGAGCGCGA GGAGCGCAGG CAGCGGGCGG CGGAGCTGCC GCGGATAGTC 
CTCGGGCCGC GCAACCTCTC GGACCTGGAG ATGATCGGGA CCGGCGTCTT CTCCCCCCTC 
ACCGGCTTTA TGGGGCGGGA GGACTACGAG AGCGTCGTGG AGGAGATGCG GCTCGCCGAC 
GGGCTGCCGT GGAGCATCCC GATCACGCTC TCCGTCTCCG AGGAGGAGGC CCGCTCCTTC 
GAGGAGGGGG ACGAGGTGGC GCTCGCCAAC GGCGAGGGCG AGATCGTGGC CACCATGGTG 
GTGGAGGACC GCTACACCTA CGACCGGGCC CACGAGGCCA AGCTCGTCTA CAGGACCACC 
GACACCGACC ACCCGGGGGT GGCCGCCCTG TTCAGGCAGG GGGACGTGCT GGTGGGCGGC 
GAAGTCTCGC TGCTCGACGA CGGGACCACC ACCCGGCCCT TCCCCCGCTA CTACTACGAG 
CCGCGGGAGC TGCGGGCCAT CTTCCGCCAG AAGGGCTGGC GGCGGGTGGT GGGCTTCCAG 
ACCCGCAACC CCGTCCACCG CGCCCACGAG TACATCCAGA AGAGCGCGCT GGAGACCGTG 
GACGGCCTGC TTTTGAACCC GCTCGTCGGC GAGACCAAGT CCGACGACAT CCCGGCCCAT 
GTCCGGATGC GCTCCTACGA GGTGCTGCTG GAGCGCTACT ACCCGCGGGA CCGGACCGTG 
CTCGCCGTCT TCCCGGCGGC CATGCGCTAC GCCGGGCCGC GGGAGGCCGT CTTCCACGCC 
ATCTGCCGCA AGAACTACGG CTGCACCCAC TTTATCGTGG GGCGGGACCA CGCCGGGGTG 
GGCAACTACT ACGGCACCTA CGACGCCCAC CGCATCTTCG ACGAGTTCGA GCCCGGCGAG 
CTCGGCATAA CCCCGCTGTT CTTCGAGCAC GCCTTCTTCT GCCTCAACTG CGGCGGGATG 
GCGACGACCA AGACCTGCCC GCACGACAAG GACTCCCACG TCTTCTTCTC GGGCACCCGG 
GTGCGGGAGA TGCTGCGCAA CGGCGAGTAC CCGCCGCCGG AGTTCTCCCG GCCCGAGGTT 
ATAGAGGTGC TGATCTCGGG GCTCAGGCAA CAGGAGGGAT GA

Protein sequence

MMRTEYTTIT PHGGTLVDRR VPVGEREERR QRAAELPRIV LGPRNLSDLE MIGTGVFSPL 
TGFMGREDYE SVVEEMRLAD GLPWSIPITL SVSEEEARSF EEGDEVALAN GEGEIVATMV 
VEDRYTYDRA HEAKLVYRTT DTDHPGVAAL FRQGDVLVGG EVSLLDDGTT TRPFPRYYYE 
PRELRAIFRQ KGWRRVVGFQ TRNPVHRAHE YIQKSALETV DGLLLNPLVG ETKSDDIPAH 
VRMRSYEVLL ERYYPRDRTV LAVFPAAMRY AGPREAVFHA ICRKNYGCTH FIVGRDHAGV 
GNYYGTYDAH RIFDEFEPGE LGITPLFFEH AFFCLNCGGM ATTKTCPHDK DSHVFFSGTR 
VREMLRNGEY PPPEFSRPEV IEVLISGLRQ QEG