Gene Acid345_3918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3918
Symbol
ID	4071301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4631745
End bp	4632782
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	56%
IMG OID	637985944
Product	homoserine O-acetyltransferase
Protein accession	YP_592992
Protein GI	94970944
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.759741
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0489209
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATCGAT GGTTATTAAT CTGCGCTACG GTACTCATGC TTGGTGGATT TGCGCTTGCC 
GAGGGTGAGC AGCAATTCGC GGATCTTGGG CAGTGCAAGG TCGAGAGCGG CGAGACTATC 
CAGAATTGTC GCATCGGGTA TCGCACTTGG GGCAAGTTGA ACGCGGAGCA GTCGAATATC 
GTGGTCCTGC TGACGTGGTT CACCGGAACG AGCGAGCAGC AGGCCGGGAG CGTGGGCGCC 
GATAAATACG TGGATCCCGC GCACTATTAC GTTGTCGCGA TTGATGCGCT GGCGAATGGC 
GTGAGTTCAT CACCGTCAAA CAGCAAAGCG CAGCCGAGAA TGAAGTTTCC GCAGATCACC 
ATCGCCGACA TGGTGGAATC GCAGCATCGG TTGTTGACCG AGACGCTGAA GTTGAAGCAC 
ATTCGCGCTG TGCTCGGTGG TTCCATGGGC GGGATGCAGG CGTTTCAATG GGCGGTGCAA 
TATCCGGATT ACATGGACGC GGTGATCTCC ATCGTGGGCA CCACGCAGAT GACAGCACAC 
GACCTGTTGC TGTGGCGCGC GGAGAAGAAT GCGATTCTCG AAAACAAGAA CTTTAACGAT 
GGAGATTACA AGGCGGGCTT GCTGATTCCG TCGGTGGCAG ACATTCACCA CTTGGAGTTG 
ACGACGCCGG ACAGAATCAA CGACGACACG CTGCCAAAGA ACTTTCCGAC GGCAGCGGAG 
AAGATCGAAG CGTCAGAGAC GATGGACCCA TGCGATCGGT TGCGTCAACT CGATGCGATG 
ATGACGCACG ACATCTCGAT GCGATTCAAC GGACAGATGT CTGGCGCGGC GAAGGCGGTG 
AAGGCACACA TGCTGATTAT CGTGTCGAAC AGTGACCACA TGGTCAACCC GCATCCGGCC 
ATGGTGTTTG CCGAGCTATT GCTGAATGTC CCGATGCAGC TCGATTCTAC TTGCGGCCAT 
CTTGCGCCTG GATGCCGCGA AGAACAAGTG GTACCGGCAG TTCACCGAGC TCTCGAACTG 
AAGTCATTCT TGCAATGA

Protein sequence

MYRWLLICAT VLMLGGFALA EGEQQFADLG QCKVESGETI QNCRIGYRTW GKLNAEQSNI 
VVLLTWFTGT SEQQAGSVGA DKYVDPAHYY VVAIDALANG VSSSPSNSKA QPRMKFPQIT 
IADMVESQHR LLTETLKLKH IRAVLGGSMG GMQAFQWAVQ YPDYMDAVIS IVGTTQMTAH 
DLLLWRAEKN AILENKNFND GDYKAGLLIP SVADIHHLEL TTPDRINDDT LPKNFPTAAE 
KIEASETMDP CDRLRQLDAM MTHDISMRFN GQMSGAAKAV KAHMLIIVSN SDHMVNPHPA 
MVFAELLLNV PMQLDSTCGH LAPGCREEQV VPAVHRALEL KSFLQ