Gene Cphamn1_1839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_1839
Symbol	sat
ID	6375530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	1996195
End bp	1997409
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	49%
IMG OID	642684335
Product	sulfate adenylyltransferase
Protein accession	YP_001960237
Protein GI	189500767
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2046] ATP sulfurylase (sulfate adenylyltransferase)
TIGRFAM ID	[TIGR00339] ATP sulphurylase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0886206
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0259449
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCTTGG TAAATCCGCA TGGAAAAGAT AAGGTTTTAA AGCCGCTGTT ATTGTCCGGT 
GAGGAATTGC AGAATGAGAT GGAAAAAGCG AAGTCACTGA AAGAGGTTCG CTTGTCGTCG 
AGGGAGACCG GCGATCTCAT CATGCTCGGA ATAGGTGGAT TTACTCCTTT GGAAGGGTTT 
ATGGGGTACG ACGACTGGAA GGGAAGTGTA GAGAACTGTA TGATGGCTGA TGGAACGTTC 
TGGCCGATTC CTATCACGCT TTCGACCTCG AAGGAACTTG GTGACACCCT CGGTATAGGA 
GAGGAAGTTG CGCTTGTTGA CGATGAATCC GGCGAGCTTA TGGGGAGCAT GGTTGTCGAA 
GAGAAGTACG AGATCGACAA GGCTCATGAG TGCAGGGAGG TTTTCAAGAC TGACAATATC 
GAGCATCCCG GTGTCCTGCA GGTTATGCAA CAGGGTGAGG TGAATCTCGG TGGTCCTGTA 
AAAGTTTTCA GTGAAGGTTC TTTTCCTTCC GAGTTTGCAG GTGTATATAT GACTCCTGCA 
GAGACAAGGG CGCTTTTCGA GAAAAACGGA TGGAGTACCG TTGCCGCCTT TCAGACAAGA 
AATCCCATGC ACCGCTCACA TGAGTATCTT GTCAAAATCG CGATTGAAAT CTGTGACGGC 
GTGCTGATTC ATCAGCTTCT CGGTAAACTG AAGCCCGGTG ATATCCCTGC GGATGTCAGA 
AAAGATTCCA TCAACGCCTT GATGGAGAAC TACTTTGTAA AGGGAACCTG TATTCAGGGC 
GGCTATCCTC TCGATATGCG CTATGCCGGT CCGAGAGAGG CGCTTCTTCA TGCTCTGTTC 
AGGCAGAACT TCGGCTGCAG TCACCTGATT GTCGGTAGAG ATCACGCCGG TGTCGGTGAC 
TACTATGGCC CCTTTGACGC GCATCACATT TTTGATGAAA TTCCCCGGGA TGCTCTCGAA 
ACAAAACCTC TCAAGATAGA CTGGACTTTT TACTGTTACA AATGTGACGG TATGGCCTCC 
ATGAAGACCT GTCCTCATGG TAAGGATGAC AGATTGAGCC TGAGCGGCAC GAAGCTCAGA 
AAGATGCTTT CTGAAGGCGA GGAAGTTCCC GATCACTTCA GCCGTCCTGA AGTTCTTGAG 
ATTCTGAAGA AATATTATGC CGGCCTTGAA GAGAAAGTAG AGGTCAAGAT GCACACCCAT 
GCAGAGGGTA AATAA

Protein sequence

MPLVNPHGKD KVLKPLLLSG EELQNEMEKA KSLKEVRLSS RETGDLIMLG IGGFTPLEGF 
MGYDDWKGSV ENCMMADGTF WPIPITLSTS KELGDTLGIG EEVALVDDES GELMGSMVVE 
EKYEIDKAHE CREVFKTDNI EHPGVLQVMQ QGEVNLGGPV KVFSEGSFPS EFAGVYMTPA 
ETRALFEKNG WSTVAAFQTR NPMHRSHEYL VKIAIEICDG VLIHQLLGKL KPGDIPADVR 
KDSINALMEN YFVKGTCIQG GYPLDMRYAG PREALLHALF RQNFGCSHLI VGRDHAGVGD 
YYGPFDAHHI FDEIPRDALE TKPLKIDWTF YCYKCDGMAS MKTCPHGKDD RLSLSGTKLR 
KMLSEGEEVP DHFSRPEVLE ILKKYYAGLE EKVEVKMHTH AEGK