Gene Acid345_4165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4165
Symbol
ID	4072124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4930892
End bp	4931914
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	58%
IMG OID	637986196
Product	homoserine dehydrogenase
Protein accession	YP_593239
Protein GI	94971191
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.250616
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACAG TCACAAGAGC GGTGTACAAC CTTGCGTTGG TCGGGTTCGG CAACGTGGGG 
AAGACGTTTG TCTCGTTGCT GGACCGGAAG CGAGCAGAAC TCGGGACACG ATATAACCTG 
GATTTCCTGA TTTCGGGCAT TGCGAGCCGC AAGCTGGGAT GGCTGGTGAA TCCTACGGGT 
TTCGAGCCAG ATCAGGTTCT GGAGGGAGAT TTCTCCGGAG CATTGAAGGT GGATTCGCTG 
CGGAGCTGGA TTCTGGCATC GCGGCCGGAT GCGGTGTTTG AGACGACCTC GCTGAATCCG 
CAAACGGGAC AGCCTGCGAT TGAGCATCTG CGATGCGCGC TGGAGTTTGG GGCGCATGCG 
ATCTCCGCGA ATAAAGGGCC GGTGGTGCAT GGATATGAAG AACTGACTAC GCTGGCGAAG 
CAGATGCACC GGAAGTTTTA CTTCGAGTCG TCGGTAATGG ACGGCGCGCC AGTGTTCAAC 
TTGTTTCGTG AGTGCTTGCC GACGATCGAG CTGCGCGGGT TCCGCGGGAT TTTGAATTCG 
ACGACGAACG TAATCCTGGA GCGAATGGAG CAAGGACAAT CGTTTGAGGA CGCGGTGCGG 
CATTGCCAGG AGATTGGTGT AGCGGAGAGC GATCCGTCGA ATGACATTGA CGGGTGGGAC 
GCAGCAGTGA AGGTCGCGGC GTTGGCGACG GTGCTGATGG GGCATCCGAT GAAACCGGAC 
CAGGTGGAAC GCGGCGGGAT TGGTGAGATC ACGGCGGAGC AGATTGCGGC AGCTCACACC 
GATGGGAAGC GCTATAAAGT GGTGTGCAGC GCGAAGCGCG ATGGAGAGCG TCTGCGGGCG 
AGGGTTGCGC CGGAGTTGCT GCCGCTGACG GATCCACTGG CACAGGTGAG TGGGACGTCG 
TCACTGATTT CGTTTGAGAC CGATGTGCTG CCGGAATTAG CGATCCATGA GATCAACCCG 
GGGCTGGATG CAGTCGCGTT TGGGCTGCTG ACAGATTTTC TGAGAGCGGT AAAGGAGTCG 
TAA

Protein sequence

MATVTRAVYN LALVGFGNVG KTFVSLLDRK RAELGTRYNL DFLISGIASR KLGWLVNPTG 
FEPDQVLEGD FSGALKVDSL RSWILASRPD AVFETTSLNP QTGQPAIEHL RCALEFGAHA 
ISANKGPVVH GYEELTTLAK QMHRKFYFES SVMDGAPVFN LFRECLPTIE LRGFRGILNS 
TTNVILERME QGQSFEDAVR HCQEIGVAES DPSNDIDGWD AAVKVAALAT VLMGHPMKPD 
QVERGGIGEI TAEQIAAAHT DGKRYKVVCS AKRDGERLRA RVAPELLPLT DPLAQVSGTS 
SLISFETDVL PELAIHEINP GLDAVAFGLL TDFLRAVKES