Gene HMPREF0424_1231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HMPREF0424_1231
Symbol
ID	8708802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gardnerella vaginalis 409-05
Kingdom	Bacteria
Replicon accession	NC_013721
Strand	-
Start bp	1463516
End bp	1464886
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	48%
IMG OID	646483319
Product	homoserine dehydrogenase
Protein accession	YP_003374424
Protein GI	283783670
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.0000000217271
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAAAGCA ATCAGTCGAC TAAAACTATT CGCGTAGGCC TACTTGGGGC TGGAACTGTT 
GGGTCTCAAA CAGCGCGACT AATAGTTGAA CAGTTCAATG AGCTTAAGAA GCGAACTGGC 
GCTGAAATTG AGCTTGCAGC AGTTGCATGC TTACGCCCGG AAGAAGTTGA CGCTCCTTGG 
ATTAAGCGTG ATTTGCTAAC TACAGACACT GCCTCTTTGT GCGCTCGCGA AGACATTGAT 
ATTATAGTCG AGCTTATTGG CGGACTTGAG CCGGCTCATA CTTTTGTAAA AAGTGCGCTA 
TGCCACGGAA AATCTGTTGT TACTGCAAAT AAAGCGTTGC TTGCGAAGTT TGGTCCGGAA 
TTATACGAGT GTGCAGAAAG TCACGGAGTT GACTTGTACT TTGAGGCGGC TGTAGCGGGA 
GCGATTCCTA TTGTTCGACC GCTTCGAGAG TCGCTTATTG GTGACAAAAT TACGCAAATT 
TTCGGAATTG TAAACGGAAC TACCAACTAT ATTCTTGACG AAATGACTGT GCGCGGACTT 
GATTTTGATT TGGTTTTGCA CGCGGCTCAA GAAAAGGGTT ATGCTGAGGC AGATCCGACC 
GGAGATGTTG AAGGTTTCGA TGCTGCAAAT AAAGCTGCGA TTCTTGCAAC TCTTGCATTC 
CAAATGCCAG TAAGTATTGA CGATGTATCC GTTGAAGGAA TTAGCGCGAT TACTGCTGAA 
GATATTGCTG CAGCGAGCGC GGAAAAGCGT GTAATTAAGC TACTTGCAGC AGTCGAAAGG 
CATTGCGATG GTAAGTCAAA ATCGGATGGC GGAGTAAGTG TTAATGTGTA TCCGGCGCTT 
GTTGGTGCGG AGCACCCTTT GGCGTCGGTT CACGGCAGTT TTAATGCTGT GTTTGTGAAG 
GCGCAGGCTG CGGACGATTT GATGTTCTAC GGACGCGGTG CCGGCGGTGC TCCAACTGCA 
AGTGCTGTTG TTGGAGATGT TGTTAGTGCT GCTCGAAATC TTGTGCGTGG ATGCGCAGGT 
TTTGGCGTGC CAATGTATAA CAAGTATGTG CCGGCTTCTA GCGAGCAGAC TAGAGCGGAT 
TTTGTGATTC GTTGCAATAT GGAAGATACT TCTTTGGCTT TGTGCAGCGA AGTTATGGAT 
GTTTTTGTAG ATTATGGCGT TGCAGCTGAA CGTTTGGCTT CGGCGTGCCA AGCTAAGTAT 
GCGCAAACTG AAGCTGATTC GGATTGCCCA CAGTGCGGTC TTGGTGGACC TGGCAGTGTG 
CGCGTGCTTG TGCGCGAATG TTCGGAAGCT GCAGTTCAAG CTATTTGTGA GGATTTGCAG 
AAGTTGGATG TTGTGTGTGG AAAGCCGCTA GTTTTGCGCG TTATAAAGTA G

Protein sequence

MQSNQSTKTI RVGLLGAGTV GSQTARLIVE QFNELKKRTG AEIELAAVAC LRPEEVDAPW 
IKRDLLTTDT ASLCAREDID IIVELIGGLE PAHTFVKSAL CHGKSVVTAN KALLAKFGPE 
LYECAESHGV DLYFEAAVAG AIPIVRPLRE SLIGDKITQI FGIVNGTTNY ILDEMTVRGL 
DFDLVLHAAQ EKGYAEADPT GDVEGFDAAN KAAILATLAF QMPVSIDDVS VEGISAITAE 
DIAAASAEKR VIKLLAAVER HCDGKSKSDG GVSVNVYPAL VGAEHPLASV HGSFNAVFVK 
AQAADDLMFY GRGAGGAPTA SAVVGDVVSA ARNLVRGCAG FGVPMYNKYV PASSEQTRAD 
FVIRCNMEDT SLALCSEVMD VFVDYGVAAE RLASACQAKY AQTEADSDCP QCGLGGPGSV 
RVLVRECSEA AVQAICEDLQ KLDVVCGKPL VLRVIK