Gene Hhal_2354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2354
Symbol
ID	4709077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2579540
End bp	2581453
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	70%
IMG OID	639856829
Product	sulfate adenylyltransferase, large subunit
Protein accession	YP_001003919
Protein GI	121999132
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0529] Adenylylsulfate kinase and related kinases [COG2895] GTPases - Sulfate adenylate transferase subunit 1
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00455] adenylylsulfate kinase (apsK) [TIGR02034] sulfate adenylyltransferase, large subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.643084
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCACG CCTCCGATCT CATCGAAACC GACATCGAGC GCTACCTCAA GCAGCACGAG 
CACAAGGACC TGCTGCGCTT CATCACCTGC GGCTCGGTGG ACGACGGCAA GAGCACCTTC 
ATCGGCCGGC TGCTGCACGA CTCGGCGCTG GTCTACGAGG ATCAACTGGC CGCCGTGCGG 
CAGGACTCCA CCCGCTACGG CACCACCGGC GACGACGTGG ACCTGGCGCT GCTCGTCGAC 
GGCCTGCAGT CCGAGCGCGA GCAGGGCATT ACCATCGATG TCGCCTACCG CTACTTCTCC 
ACCGACCGGC GCAAGTTCAT CATTGCCGAC ACCCCGGGCC ACGAGCAGTA CACCCGCAAC 
ATGGCCACCG GCGCCTCGAC GGCGCAGCTG GCGGTGATCC TGGTCGATGC CCGCCACGGG 
GTGCAGGTGC AGACCCGGCG GCACAGCTAC ATCTGCGCCC TGCTGGGGAT CCGCCACGTG 
CTGCTGGCCG TCAACAAGAT GGACCTGGTC GATTGGGATC AGGGCACCTT CGAGGCGATC 
CGCGACGAGT ACACCGCCTT CGCCCGCCGC CTCGGCATCC CCGATGTGCG CTGCGTGCCG 
CTGTCCGCGC TCAAGGGGGA TAACGTCGTC CACCGCGGCG AGCACCTGCC CTGGTACGAC 
GGCCCAACGC TCATGGAGCT GCTGGAGACC GTGGAGGCCA AGGCCGACCG CAATCTGCGC 
GATCTGCGCC TGCCGGTGCA GACTGTGGTC CGCCCCTCCC ACGACTTCCG CGGCTTCGCC 
GGCACCCTGG CCGCCGGCAC GGTGCGCCCC GGGGACGAGG TCGTGGCCCT GCCTTCCGGG 
CTGCGCAGCC GCGTGGCGCG CATCGTCACC TACGACGGCG ACCTCGACGT GGCCTTTCCG 
CCGCAGTCGG TGACCGTCAC CCTGACCGAC GAGATCGACG TCTCACGCGG CGATGTCCTG 
GCCAGCCCGA CCCACCCGGC CACCGTGGAC GACACCCTGG ATGCGCGCAT CGTGTGGATG 
GCCGAGCAAC CGCTGCTGCC CGGACGCCAG TACGACATCA AGCTGGGCAC GGCCACCGTC 
CCGGCCGTGG TCGAACGGAT CCACCACCGC ATCGACGTCA ACACCCTCGA GCACCACCAG 
GTGGAGGAAC TCGGGCTCAA CGAGATCGGC CTGTGTCGCG TCCAGCTCTC CGCCCGGGTG 
CCCTTTGACC CCTACGACGA GATCGCCAAC ACCGGATCGT TCATCGTCAT CGACCGGATG 
AGCCTGCACA CCGTCGGCGC CGGCATGGTC ACCCGCGCGG CAACCGAGGC CGCCGGCGCC 
GAGACCGATG TCCCGCGCCG CCGGCTGGCC CTGAGCAAGG CCCAGCGCGC CGGGCAGAAG 
GGGCAGCGGC CGTGCATCGT CTGGCTCACC GGGCTGTCCG GCTCCGGCAA GTCGAGCCTG 
GCCAACGCCC TGGAGCAGGC GCTGTTCCGG CGCGGCTACC ACAGCTACCT GATCGACGCG 
GGCAACGTCC GCCACGGGCT GAGCCACGAC CTGGACTTCA GCCGCGACGC GCGGGCCGAG 
AACATCCGCC GCATGGCCGA GACAGCCACC ATGTTCGTCG ACGCCGGGCT GATCACCGTC 
TGCGCCAGCC TCTCGCCGTA CCGCGACGAC CGCGCCATGG TCCGCGAGCG GGTCGAACCC 
GGCGAGTTCA TCGAGGTGCA CGTGGACGCC ACCATCGACG CGTGCCGCGC CGCGGACCTG 
GACGGGCTCT ACGCCCGCGC CGACGCTGGC GAGATCCAGG GCCTGCCCGG TGTGGACATC 
CCCTACGAGG CGCCGGAACA GCCCGAGGTC CGCGTGGACA CGGTGGCCGA GGACCTGGAG 
ACCTCGGTGC GCAAGATCCT CACCGCCCTG GAGGAGCGCG GGGTGCTGCG CTAG

Protein sequence

MSHASDLIET DIERYLKQHE HKDLLRFITC GSVDDGKSTF IGRLLHDSAL VYEDQLAAVR 
QDSTRYGTTG DDVDLALLVD GLQSEREQGI TIDVAYRYFS TDRRKFIIAD TPGHEQYTRN 
MATGASTAQL AVILVDARHG VQVQTRRHSY ICALLGIRHV LLAVNKMDLV DWDQGTFEAI 
RDEYTAFARR LGIPDVRCVP LSALKGDNVV HRGEHLPWYD GPTLMELLET VEAKADRNLR 
DLRLPVQTVV RPSHDFRGFA GTLAAGTVRP GDEVVALPSG LRSRVARIVT YDGDLDVAFP 
PQSVTVTLTD EIDVSRGDVL ASPTHPATVD DTLDARIVWM AEQPLLPGRQ YDIKLGTATV 
PAVVERIHHR IDVNTLEHHQ VEELGLNEIG LCRVQLSARV PFDPYDEIAN TGSFIVIDRM 
SLHTVGAGMV TRAATEAAGA ETDVPRRRLA LSKAQRAGQK GQRPCIVWLT GLSGSGKSSL 
ANALEQALFR RGYHSYLIDA GNVRHGLSHD LDFSRDARAE NIRRMAETAT MFVDAGLITV 
CASLSPYRDD RAMVRERVEP GEFIEVHVDA TIDACRAADL DGLYARADAG EIQGLPGVDI 
PYEAPEQPEV RVDTVAEDLE TSVRKILTAL EERGVLR