Gene SAG1678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1678
Symbol
ID	1014487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1673684
End bp	1675066
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	37%
IMG OID	637316847
Product	HAD superfamily hydrolase
Protein accession	NP_688669
Protein GI	22537818
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG0561] Predicted hydrolases of the HAD superfamily [COG4696] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR00099] Cof subfamily of IIB subfamily of haloacid dehalogenase superfamily [TIGR01484] HAD-superfamily hydrolase, subfamily IIB

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000161748
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAATTA AGGCAGTATT TTTTGATATT GATGGTACAC TTCTTAATGA TCGTAAGAAT 
GTACAAAAGT CAACAATTAA AGCAATTCGA AATTTGAAAG ACCAAGGAAT ACTAGTCGGT 
TTAGCAACGG GGCGAGGTCC TAGTTTTGTA CAACCTTTTT TAGAAAACCT TGGTTTAGAT 
TTTGCTGTAA CCTATAATGG TCAATATATC TATAGTAGAA GTGAAATTAT TTATACCAAT 
CAATTATCTA AGACAACTGT CTATCGTCTG ATTCGTTATG CTGGAGCAAG AAGAAGAGAA 
ATTTCATTAG GAACAGCCTC AGGATTACTC GGTTCAGGTA TTATTGGTCT AGGAACTAGC 
CGTTTGGGGC AGATTGTATC TAGCCTTGTT CCGAGAAAAT GGGCAAAAGC GATTGAACGA 
AGCTTTAAGC ATTTTATTCG TCGGATTAAA CCTCAAAATA TTGATAGCCT CATGGTTATC 
TTACGAGAAC CTATTTATCA GGTCGTTTTA GTTGCAACAG AGGGCGAATC AGAGCGAATT 
CAAAAACAAT TTCCTCGTGT TAAATTAACA AGAAGCAGTC CTTACTCAAT GGATGTCATT 
TCTGAAGGGC AGTCAAAAGT TAAGGGAATT GAACGTGTTG GTCAACGCTA TGGTTTTGAT 
CTATCCGAAG TGATAGCATT TGGAGATTCT GATAATGATA TTGAGATGTT ATCTCAAGTT 
GGCATTGGTG TTGCCATGGG GAACGCTAGT CAGCAAGTGA GAGAAAATGC ACGTTATACA 
ACTGCTGACA ATAATGATGA TGGTATCTCT AAGGCATTAG CCCATTATGG ACTTATCCAA 
TTTGAGATTG AAAAAACATT CAGTAGTCGT GACGAGAATT TCAATAAAGT AAAATCCTTC 
CATCTATTAA TGGATGGTGA AACTATTGAA ACGCCACGCT TATATGACAG TAAGGAAGCT 
GGTTTCAGGT CAGACTTTAA AGTAGAAGAA ATCGTTGAGT TCTTGTATGC TGCTAGTCAA 
GGTAACCAAA AAGTATTTGA CCAATCTATC CGTAATTTAC ACTTAGCTAT TGATAAAGCA 
AGAGATAAGG TTATTTCTAA AGACCATCCA GAAACACCAT TAGTGGGAGA AGTGGATGCC 
TTAACAGATT TACTTTATCT GACTTATGGC TCCTTTGTTC TTATGGGAGT CGACCCAAAA 
CCTCTTTTTG ATACAGTACA TGAGGCCAAT ATGGGGAAAA TCTTTCCAGA TGGCAAAGCT 
CATTTTGATC CTGTTACTCA TAAAATTTTA AAACCAGACG ACTGGGAAGA ACATTTCGCT 
CCTGAGCCAT CAATTCGACG TGAATTAGAT AGCCAAATTC AGAAATCCTT AAATCGAAAA 
TAA

Protein sequence

MAIKAVFFDI DGTLLNDRKN VQKSTIKAIR NLKDQGILVG LATGRGPSFV QPFLENLGLD 
FAVTYNGQYI YSRSEIIYTN QLSKTTVYRL IRYAGARRRE ISLGTASGLL GSGIIGLGTS 
RLGQIVSSLV PRKWAKAIER SFKHFIRRIK PQNIDSLMVI LREPIYQVVL VATEGESERI 
QKQFPRVKLT RSSPYSMDVI SEGQSKVKGI ERVGQRYGFD LSEVIAFGDS DNDIEMLSQV 
GIGVAMGNAS QQVRENARYT TADNNDDGIS KALAHYGLIQ FEIEKTFSSR DENFNKVKSF 
HLLMDGETIE TPRLYDSKEA GFRSDFKVEE IVEFLYAASQ GNQKVFDQSI RNLHLAIDKA 
RDKVISKDHP ETPLVGEVDA LTDLLYLTYG SFVLMGVDPK PLFDTVHEAN MGKIFPDGKA 
HFDPVTHKIL KPDDWEEHFA PEPSIRRELD SQIQKSLNRK