Gene HS_1650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1650
Symbol	cysQ
ID	4241177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1881915
End bp	1882889
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	37%
IMG OID	638105236
Product	3'-phosphoadenosine 5'-phosphosulfate (PAPS) 3'-phosphatase
Protein accession	YP_719855
Protein GI	113461786
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1218] 3'-Phosphoadenosine 5'-phosphosulfate (PAPS) 3'-phosphatase
TIGRFAM ID	[TIGR01331] 3'(2'),5'-bisphosphate nucleotidase, bacterial

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTTTATA AAAGCGTGCA GCCCATAGCC ATTTATCGAG CCGAATACTA TCATCTTTTT 
CCTTGGGTAA ATGCTGTTTT GCCATATTTG TCTTTTCGTT CAGTTAAAAT CAGGGGTATG 
ATAGGGGGAT TAAAGACATT TGTAAAAGGG AAGATTATGA ATGAATTAAA AAGTCAGGTA 
CTACTGGAAA AGGTTTTACA AATCGCTCAT CAAGCTGGAG ACTATCTTAA TCTTTTTTAC 
AATGGAGAAA TTGATTTTCA GATCAACATA AAATCGGATA ATACGCCTAT CACAAACGCA 
GATTTATTTG TAAACCAATT TCTTATCGAA AAACTGACCG CACTTACGCC ACATATCCCT 
GTTTTATCAG AAGAAAGCTG TCAAATTTCT TTTTCAGATC GACGGCGGTG GCGTACTTAT 
TGGTTGATTG ATCCGCTGGA TGGTACACAA CAATTTATTA ATCGAACAGA TCAATTCGCT 
GTGCTAATTG CACTGATTCA TCAAAATCGG AGCATGTTAG GTATTATTCA TGCTCCCGTG 
TTAAAACAAA CTTATTATGC ACTGCAAGGT CATGGTACTT ATAAACAAAC GGAACATTCT 
CTGCAAACTT TATCAGCTAG AAAATTTGGC TTAAACCATA CAGTAAAAAT TGCAGTAGGT 
TCAAAAAATG CGGAGCAAAA AGTGCGGTCA ATTTTGAGCT CAAATTATCA ATACGAATTT 
ATTACTTATG GTTCTAGCGG TTTAAAAACC GCACTGGTTG CAGAAGGAAG TGCAGATTGC 
TATATTCGAC TGGGACAAAC CGGTGAATGG GACACGGCTG CGGCGGAAGC CATTTTATCC 
GAAATAGGCG GAGGAATCCG TGATACCCAA TTCAACGCCC TAACTTATAA CAAACGACCG 
AGTTTAATAA ACCCTGATTT TATTATGGTA TCGGACATAT CTGCCGATTG GAAAAAAATC 
TTTCAATTTA ATTAA

Protein sequence

MFYKSVQPIA IYRAEYYHLF PWVNAVLPYL SFRSVKIRGM IGGLKTFVKG KIMNELKSQV 
LLEKVLQIAH QAGDYLNLFY NGEIDFQINI KSDNTPITNA DLFVNQFLIE KLTALTPHIP 
VLSEESCQIS FSDRRRWRTY WLIDPLDGTQ QFINRTDQFA VLIALIHQNR SMLGIIHAPV 
LKQTYYALQG HGTYKQTEHS LQTLSARKFG LNHTVKIAVG SKNAEQKVRS ILSSNYQYEF 
ITYGSSGLKT ALVAEGSADC YIRLGQTGEW DTAAAEAILS EIGGGIRDTQ FNALTYNKRP 
SLINPDFIMV SDISADWKKI FQFN