Gene SAG1120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1120
Symbol	hom
ID	1013924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1126866
End bp	1128149
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	36%
IMG OID	637316302
Product	homoserine dehydrogenase
Protein accession	NP_688129
Protein GI	22537278
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTATTA AAATAGCTTT ATTAGGTTTT GGAACGGTTG CTAAGGGTAT TCCATATTTG 
CTAAAAGAAA ATCAACATAA GCTACTTTCT TTAGAAGGCG AAGATATTGT GATTGATAAA 
GTATTAGTAA GAGATAATGA AAGCCGCCAG CGTTTCATCA ATCAGGGATT TACTTATAAC 
TTTGTGACAG AGATAAATAC TATTCTTCAA GATTCACAAA TTGATATTGT AGTGGAATTA 
ATGGGGGGGA TTGAGCCAGC TAAAACTTAT TTGAGTCAAG CATTAGGATT TGGTAAACAT 
ATTGTGACAG CCAATAAAGA TCTCATTGCT TTACACGGAA AAGAGTTGAT GGATTTAGCA 
GACGCTAGAG GTCTAGCTTT ATTCTATGAG GGAGCAGTTG CTGGAGGCAT TCCTATTTTA 
AGGACCCTAT CGCATTCGTT TGCCTCAGAT AAAATGACAC GTTTATTAGG AATTCTCAAC 
GGTACCTCCA ACTTCATGTT AACAAAAATG TTTGAAGAGG GATGGTCTTA TGAACAAGCT 
CTAAAAAAGG CACAAGAGTT AGGTTATGCT GAAAGTGATC CCACAAATGA TGTTGAAGGT 
ATTGATACTG CCTACAAAGC CACTATCTTA AGTCAATTTG GATTTGGTAT GCCTATTGAT 
TTTGATGATG TTAATTATAA GGGGATTTCT AGTATTCGCT CAGAGGATGT TGAAGTAGCT 
CAGGAGATGG GCTTTGCCAT TAAGTTGGTA GCTGATCTTC GTGAAACTCC AACTGGTATA 
AGTGTAGACG TTTCTCCGAC ACTAATTTCT CAAAAGCATC CCTTAGCTGC AGTTAATCAT 
GTGATGAATG CAGTATTCAT TGAATCAATA GGGATTGGTC AGTCTCTTTT TTATGGACCA 
GGTGCGGGAC AAAATCCAAC AGCAACCTCT GTTTTAGCGG ATATCATCGA TATTAGTCGT 
AGTATTCGAT CACAGATAAA AATTAAGCCT ATGAATACTT ATCATTGTCC GTGTAGGTTG 
TCAATGCAGT CTGATATTTT CAATGAGTAC TATCTAGCTA TTTCTTTGAG AAATGCTGAA 
GATAGTGATA CACTTGGAAG GTACTTTGAG CAAGAAAATA TAGGTTTGAA AAATGTTATC 
GAAAAAGCAT TGGGTGATAA ACAACAAGAA ATCTATGTAT TAACAGATGA AGTTAGCCAA 
GAGAAAATAA CTCAATTTAT TGAGGAGTTT CCTGAGAGTG GTGTCATTCA GTTAATCAAT 
GTTTTCAAAG TAATAGGAGG GTGA

Protein sequence

MTIKIALLGF GTVAKGIPYL LKENQHKLLS LEGEDIVIDK VLVRDNESRQ RFINQGFTYN 
FVTEINTILQ DSQIDIVVEL MGGIEPAKTY LSQALGFGKH IVTANKDLIA LHGKELMDLA 
DARGLALFYE GAVAGGIPIL RTLSHSFASD KMTRLLGILN GTSNFMLTKM FEEGWSYEQA 
LKKAQELGYA ESDPTNDVEG IDTAYKATIL SQFGFGMPID FDDVNYKGIS SIRSEDVEVA 
QEMGFAIKLV ADLRETPTGI SVDVSPTLIS QKHPLAAVNH VMNAVFIESI GIGQSLFYGP 
GAGQNPTATS VLADIIDISR SIRSQIKIKP MNTYHCPCRL SMQSDIFNEY YLAISLRNAE 
DSDTLGRYFE QENIGLKNVI EKALGDKQQE IYVLTDEVSQ EKITQFIEEF PESGVIQLIN 
VFKVIGG