Gene GBAA_1968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_1968
Symbol	hom-1
ID	2817031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	+
Start bp	1850762
End bp	1852057
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	36%
IMG OID	637788846
Product	homoserine dehydrogenase
Protein accession	YP_018612
Protein GI	47527263
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000000153616
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAACG TTATTCATGT AGGGGTGTTA GGATTAGGTA CGGTCGGAAG TGGTGTTGTC 
CATATTTTGA AAGAACATTA TAAAAAAATT GCACTTGATA CAGGGTATGA GGTGAAGGTG 
AAGACAGTCG TTGTACGTGA TTTAGAAAAA GAACGTGATG TTTGTATTGA TGGAATCGTA 
GTAACATGTC ATGTCGATGA AGTTCTAAAT GATCCAAATA TTGATATTGT AGTAGAGGTA 
ATGGGCGGAA TTGAAGAAGC GAAGCAGCAT ATTGTTAAGG CTTTACGAAA TAAGAAACAT 
GTCGTGACAG CAAATAAAGA TTTAATGGCT GTATACGGTG CAGAGCTTTT GCAACTGGCG 
AACGATAATG ATTGTGATCT ATGTTATGAG GCAAGTGTAG CTGGTGGTAT TCCAGTGTTA 
AGAGGACTAA CAGACGGATT AGCTTCAGAT CAAATTGAAA AAATAATGGG AATCGTAAAT 
GGAACAACAA ATTATATGTT AACAAAGATG AGTCAAAAGG GATGGTCGTA TGAAGAGGCT 
TTACAAGAAG CGCAAAAATT AGGTTTCGCA GAATCAGATC CGACAGCGGA TGTAGATGGA 
TTAGATGCAG CGAGAAAAGT AGCAATCCTT GCAAATTTAG GTTTTTCGAT GAATGTTTCT 
TTGGATGATG TGCAAGTAAG AGGGATTCGA AAGGTAGAAA AAGAAGATTT ACAAATGGCT 
GAAAAGTTAG GGTTTACTAT GAAGTTAATT GGTAAAGCAG AGAAACAGGG ATCAGCTATT 
CATTTAAGTG TAGAACCGAC ACTTTTACCA AGTCATCATC CATTGTCAAA TGTAAATAAT 
GAATTTAATG CAGTGTATGT TCACGGGCAA GCGGTAGGAG AAGTGATGTT TTACGGACCT 
GGAGCAGGTA AATTGCCGAC TGGTTCTGCA GTAGTAAGTG ATATTATTTC AATCGTTAAA 
AATATGAATC AAGTTCCGAA AAATAAAAGT GTGTTAAAAG AACCAGAGCC ATACGAATTA 
CAAGGGGATG AAGAAGTCGT TTCGAAATAT TTCTTACGTA TTTCATTACG AGATGAGCCA 
GGGATGTTAC AAAAAATAAC AGAATGTTTC GTTAATTATT CTGTAAGTTT AAAAGAAGTA 
ATTCAATTAC CTTTAAATCG TGAACTTGCA GAAGTCGTTG TTGTGACACA TCAAACTTCA 
AAGTATCAAT TCGAACGAGT TTTAGGGGCA ATAGAAGATG TCGCAAGTGA AATAAACAGT 
TACTACATTA TCGAGGAGGA AAAACAATAT GTATAA

Protein sequence

MNNVIHVGVL GLGTVGSGVV HILKEHYKKI ALDTGYEVKV KTVVVRDLEK ERDVCIDGIV 
VTCHVDEVLN DPNIDIVVEV MGGIEEAKQH IVKALRNKKH VVTANKDLMA VYGAELLQLA 
NDNDCDLCYE ASVAGGIPVL RGLTDGLASD QIEKIMGIVN GTTNYMLTKM SQKGWSYEEA 
LQEAQKLGFA ESDPTADVDG LDAARKVAIL ANLGFSMNVS LDDVQVRGIR KVEKEDLQMA 
EKLGFTMKLI GKAEKQGSAI HLSVEPTLLP SHHPLSNVNN EFNAVYVHGQ AVGEVMFYGP 
GAGKLPTGSA VVSDIISIVK NMNQVPKNKS VLKEPEPYEL QGDEEVVSKY FLRISLRDEP 
GMLQKITECF VNYSVSLKEV IQLPLNRELA EVVVVTHQTS KYQFERVLGA IEDVASEINS 
YYIIEEEKQY V