Gene Cag_1587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1587
Symbol	sat
ID	3746662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2071946
End bp	2073160
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	45%
IMG OID	637774127
Product	sulfate adenylyltransferase
Protein accession	YP_379885
Protein GI	78189547
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2046] ATP sulfurylase (sulfate adenylyltransferase)
TIGRFAM ID	[TIGR00339] ATP sulphurylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.369869
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTTGG TCAATCCCCA CGGAAAAGAA AAAGTTCTTA AGCCGCTATT GCTCACCGGT 
GAAGAGTTGA CTGCCGAAAA AGCTCGAGCG CAATCGTTTG CACAAGTGCG TTTATCGTCT 
CGTGAAACGG GCGACCTTAT TATGCTTGGT ATTGGCGGTT TTACTCCACT AACAGGCTTT 
ATGGGGCATG ATGATTGGAA GGGAAGTGTA CAAGATTGCC GCATGGCTGA TGGTACTTTT 
TGGCCTATTC CCATTACCCT TTCCACTTCA AAAGAAAAAG CTGACGAACT CTCCATAGGG 
CAAGAAGTTG CTCTTGTTGA CGATGAATCG GGTGAATTGA TGGGGAGTAT GGTTATTGAA 
GAGAAGTACT CTATTGATAA AGCTTTTGAG TGTCAAGAGG TTTTTAAAAC CACCGATCCT 
GAGCATCCAG GTGTGTTAAT GGTTATGAAC CAAGGGGATG TAAACCTTGC TGGACGTGTC 
AAAGTTTTTA GTGAAGGCAC CTTTCCTACT GAATTTGCAG GTATTTACAT GACACCTGCT 
GAAACCCGCA AAATGTTTGA GGCAAATGGT TGGAGCACAG TAGCTGCCTT CCAAACCCGC 
AACCCGATGC ACCGCTCCCA CGAATATCTT GTTAAAATTG CGATTGAAGT ATGTGATGGC 
GTTTTAATCC ATCAGCTTCT TGGTAAGCTT AAGCCGGGTG ATATTCCTGC CGATGTTCGT 
AAAGAGTGCA TTAATGCGTT GATGGAAAAA TATTTTGTGA AAGGCACTTG CATACAAGGA 
GGTTATCCGC TTGATATGCG CTATGCAGGT CCTCGTGAGG CGTTGCTTCA TGCGCTGTTC 
CGCCAGAATT TTGGTTGCAG TCACTTAATA GTTGGTAGAG ACCACGCAGG CGTAGGCGAC 
TACTATGGAC CTTTTGATGC CCACCACATT TTCGATCAAA TTCCTGCCGA TGCACTTGAA 
ACCAAACCGC TCAAAATAGA TTGGACATTC TACTGCTATA AGTGTGATGG CATGGCTTCT 
ATGAAAACTT GCCCACACAC GGCTGAAGAT CGTCTTAACC TCAGTGGCAC GAAACTACGT 
AAAATGCTTT CTGAAGGCGA GCAAGTGCCT GAGCATTTTA GCCGTCCTGA AGTGCTTGAA 
ATTCTCCAAC GTTATTATGC TTCGCTGACG CAAAAGGTTG ATATTAAACT GCATAGCCAT 
GCAGTTGGTA AATAA

Protein sequence

MSLVNPHGKE KVLKPLLLTG EELTAEKARA QSFAQVRLSS RETGDLIMLG IGGFTPLTGF 
MGHDDWKGSV QDCRMADGTF WPIPITLSTS KEKADELSIG QEVALVDDES GELMGSMVIE 
EKYSIDKAFE CQEVFKTTDP EHPGVLMVMN QGDVNLAGRV KVFSEGTFPT EFAGIYMTPA 
ETRKMFEANG WSTVAAFQTR NPMHRSHEYL VKIAIEVCDG VLIHQLLGKL KPGDIPADVR 
KECINALMEK YFVKGTCIQG GYPLDMRYAG PREALLHALF RQNFGCSHLI VGRDHAGVGD 
YYGPFDAHHI FDQIPADALE TKPLKIDWTF YCYKCDGMAS MKTCPHTAED RLNLSGTKLR 
KMLSEGEQVP EHFSRPEVLE ILQRYYASLT QKVDIKLHSH AVGK