Gene Haur_1748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1748
Symbol
ID	5733635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2034937
End bp	2036088
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	53%
IMG OID	641278890
Product	sulfate adenylyltransferase
Protein accession	YP_001544519
Protein GI	159898272
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2046] ATP sulfurylase (sulfate adenylyltransferase)
TIGRFAM ID	[TIGR00339] ATP sulphurylase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.510281
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGTTT CATCATTAAT CTTGCCTCAC GGCGGTACGT TGGTCAATCG GATTCCTAGC 
GGCCTTTTAC GCGAAAATTT GTTGCAATCG GCCCAAGATT TGCCACGAAT TGTGCTCGAC 
GAGCCGCATC GCGCCGATCT CTTGATGATT GGGATTGGTT CGTATAGCCC CTTAACTGGT 
TTCTTGAATC GCCACGATTA TAAGGCGGTC GTCGAAACGA TGCACCTCAA AAATGGCTTG 
CCCTGGTCGA TTCCGATTAC CTTGCCAATT ACCGAAGATC AAGCCTACGA TTTGGTGCTC 
GATCAGCCGG TTGCATTAAC TGATGAACAA GGCACGATTT TGGCGGTGCT CGAAGTTGAA 
GATATTTTCC CAGTTGATGT TGAACACGAA GCACAACACG TGTATCGCAC AACCGATGGC 
GCTCACCCAG GCGTGGCCCG GTTGTATGCT GCGCCACGCT GGCGAGTTGG CGGGGCGATT 
TGGTTGTTGC AAGTTGAGCA AGGGGCATTC CCACACTTGC CACGCACCCC TCAAGAAGTA 
CGTCAATCGA TCAGCGATGC TGGCTGGCGC ACGGTCGTAG GCTTTCAAAC CCGCAACCCA 
GTTCACCGCG CTCACGAATA TATTCAAAAA TGCGCCTTGG AAGTCGTCGA TGGCTTGTTG 
TTGCACCCAT TAGTTGGCAC AACCAAAAGC GATGATGTGC CAGCGCCAGC TCGCGTGCGT 
TCCTACGAGC GCTTGCTGCG TGAATACTAC CCCGCCAACC GCGTATTGCT GGGCGTTTTC 
CCTGCGCCAA TGCGCTATGC TGGCCCACGC GAAGCGATTT TCCATGCCTT GAATCGCAAA 
AACTATGGCT GCACCCACTT CATTGTTGGC CGCGACCACG CTGGGGTTGG CAGTTACTAT 
GGCACTTATG ATGCCCAATA TATTTTCAAC GAATTTGATC CAACAGCTTT GGGCATTACG 
CCGTTGTTCT TTGAACATAC CTTCTACTGC CAACGTTGTG GCGCGATGGC CTCGGCCAAA 
ACCTGCCCAC ACTCCCACGA ACACCACGTT ATTTTGAGTG GCACTGCCGT GCGGGCGCTC 
TTGTCACGCG GCGAATTACC ACCACCTGAG TTCAGCCGCC GCGAGGTTAT CGAAGAGTTG 
ATCGCTGCGT GA

Protein sequence

MAVSSLILPH GGTLVNRIPS GLLRENLLQS AQDLPRIVLD EPHRADLLMI GIGSYSPLTG 
FLNRHDYKAV VETMHLKNGL PWSIPITLPI TEDQAYDLVL DQPVALTDEQ GTILAVLEVE 
DIFPVDVEHE AQHVYRTTDG AHPGVARLYA APRWRVGGAI WLLQVEQGAF PHLPRTPQEV 
RQSISDAGWR TVVGFQTRNP VHRAHEYIQK CALEVVDGLL LHPLVGTTKS DDVPAPARVR 
SYERLLREYY PANRVLLGVF PAPMRYAGPR EAIFHALNRK NYGCTHFIVG RDHAGVGSYY 
GTYDAQYIFN EFDPTALGIT PLFFEHTFYC QRCGAMASAK TCPHSHEHHV ILSGTAVRAL 
LSRGELPPPE FSRREVIEEL IAA