Gene Acid345_1481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1481
Symbol
ID	4071651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1791448
End bp	1792743
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	60%
IMG OID	637983490
Product	homoserine dehydrogenase
Protein accession	YP_590557
Protein GI	94968509
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCGA CTTTGAAAGT GACACGCCTC CCAGAGAACG CTTCGGCGAA AGTTTGCAAG 
GTCGCACTGG TGGGCTTTGG CACCGTCGGC AGTTCGGTGG CGCGTCTGCT GGCCTCGCGT 
AATGGAGAGC TTCCCTTCCA GTTGACGCAT GTGTACAACC GCGATGTCGC ACGCAAGAAG 
GTGGATTGGG TCTCGAGCGA TGTGCAGTGG ACCGATACGT TCGATGATCT GATCAAATCG 
GACGCGGAAG TGATCGTCGA GCTGGTTGGT GGACTCGATC CTGCATACCA GTGGGTGAAA 
AGCGCACTGC TGGCGGGTAA GGCCATCGTG ACGGCAAACA AGCAGCTGAT TGCTCACCAT 
GGCAGCGAGC TGTTCGCGCT GGCGCGGGAA CGCGATCTGC ACCTTGGTTT TGGCGCCTGC 
GTTGCGGGCG GAGTGCCGGT GATCGCCGCA CTGCAAGATG GTCTGGCGGG CGATCGGCTG 
CACAAGGTGC GCGGGATATT GAATGGAACG TGCAATTACA TCCTGACGCG GATTGAACAG 
AGCGGGGCAT CGTTCGCCGA TGCGTTGGTC GAGGCTCAGA AGGCGGGACT TGCCGAGGCT 
GATCCGACCG ATGACATTGA AGGTTACGAT GCGCGCGCGA AGCTGGTCAT CCTCTCGCGC 
GTAGGCTTGA ACGCCGACGT GCGTGCGGAT GAAGTGCAGT GTCGCGCGAT CTCCGGCGTG 
CAGCAAATTG ACTTCGACTA CGCGCACCAG CTTGGCTGCA CGATTCGGCA GATTTCGCGC 
GCCGAGAAGC ACGGCAATAA GCTGTATGCG TCCGTCGAAC CGGCTTTGGT GCCGCAAACC 
GAACCTCTGG CGCGTGTGGC AGGAAGCCAG AATTTGCTGG TGAGCACCGG CGAATTTGGC 
GGCGAAACCG TGTTTGCGGG CTTCGGGGCG GGCGGCAATC CGACGGCGGT CGCGGTGGTT 
TCCGATCTGT TGCACATCGC ACGCCACAAG CCGCGCGAAT ATGACGCTGC CGATCCGGCG 
CGTTTCGCGG TGAGCAACGA CTTCGAGACG CCGCACTATG TGCGCTTCGT CATTCAGGAC 
AAACCGGGAA TCATCGCGGC GATCGCGAAC GTGCTTTCGA AGAACGGGAT TAACATTGAC 
TCCGTGTTGC AGAAGCCGGG TTGTCCGAAA ACAGAGCTGC CGTTCGTGAT GACGCTGGAA 
ACATGCAGCG CGGCGAAGCT CGACAATGCG CTCGCCGAAA TTGCGAAACT CGACTTCCAC 
AAGCAGGCGC CGTTCTGCAT GCCGATTTTG AAATAG

Protein sequence

MASTLKVTRL PENASAKVCK VALVGFGTVG SSVARLLASR NGELPFQLTH VYNRDVARKK 
VDWVSSDVQW TDTFDDLIKS DAEVIVELVG GLDPAYQWVK SALLAGKAIV TANKQLIAHH 
GSELFALARE RDLHLGFGAC VAGGVPVIAA LQDGLAGDRL HKVRGILNGT CNYILTRIEQ 
SGASFADALV EAQKAGLAEA DPTDDIEGYD ARAKLVILSR VGLNADVRAD EVQCRAISGV 
QQIDFDYAHQ LGCTIRQISR AEKHGNKLYA SVEPALVPQT EPLARVAGSQ NLLVSTGEFG 
GETVFAGFGA GGNPTAVAVV SDLLHIARHK PREYDAADPA RFAVSNDFET PHYVRFVIQD 
KPGIIAAIAN VLSKNGINID SVLQKPGCPK TELPFVMTLE TCSAAKLDNA LAEIAKLDFH 
KQAPFCMPIL K