Gene Clim_1824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1824
Symbol
ID	6355164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1999279
End bp	2000355
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	55%
IMG OID	642669427
Product	homoserine O-acetyltransferase
Protein accession	YP_001943842
Protein GI	189347313
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGGATT ACAGGGAGCT CATTTCAGAG AAGACTCGAT ATTTTGTATC GCAGAAACCG 
TTTGCAACAG AGTCTGGCGG CGTGCTGCCC GAACTGCGTA TCGCTTACAG AACATGGGGA 
AAACCTGATC AGGAGAAGAG TAACGTTATT CTGATCTGCC ATGCGTTGAC TGGTTCGGCC 
GATGCCGATG TATGGTGGGA CGGCATGTTC GCCGAAGGGG GTGCGTTCGA TGAGGCGAAA 
GATTTCATTA TCTGCTGCAA TGTGCTTGGA AGCTGTTACG GCACAACCGG TCCGCTGTCG 
CTGAATCCGC TGACAGGCCG ACATTACGGG CCTGATTTTC CCCGAATCAC CATCCGCGAC 
ATGGTGCATG CCCAGAGGCT GCTGCTTGAC GAATTCGGTA TCGATCGCAT TCGTCTTGTG 
GTCGGCGCTT CACTCGGCGG CATGCAGGTG CTCGAGTGGG GATTCCTTTA CCCGAAAATG 
GTGCAGGCCA TGATGCCGAT GGGGGTTTCC GGGCGACATT CGTCATGGTG CATTGCCCAG 
AGTGAGGCTC AGCGTCAGGC TATCTATGCC GATCGCGACT GGAACGGCGG CTGGTATGCG 
GCAGATTGTC CGCCGGCTTC GGGTCTGGCG GCTGCGAGGA TGATGGCCAT GTGCAGCTAC 
CGGAGTTTCG AGAATTTCCA GTCCCGTTTC GGGCGTGATG TTCAGGATGA CGGGTTGTTC 
CGGGTGGAGA GCTATCTGCA CTATCAGGGG CGGAAGCTGG TTGACCGGTT TGATGCCAAC 
ACCTATGTGA CCCTGACGAA AGCCATGGAT ATGCATGATC TTTCGAGGGG AAGAGGCGTG 
TATGAAGAGG TTCTCGGCTC ATTGCAGATA CCGGTGGAAA TTCTCTCCAT CATCAGTGAT 
GTGCTCTATC CGAAAGAGGA GCAGGAGGAG CTCGGACGGC TCATGCAGCA TTCACGGGTG 
ATCTATCTCG ACGAACCTTA CGGCCATGAC GCTTTTCTTA TCGATGTCGA AAAGGTAGGC 
CGGATGGTCA GGGAGTTCAA GGATGAACGG GCAGTCAAGG CGCACAGCGC AGCCTGA

Protein sequence

MRDYRELISE KTRYFVSQKP FATESGGVLP ELRIAYRTWG KPDQEKSNVI LICHALTGSA 
DADVWWDGMF AEGGAFDEAK DFIICCNVLG SCYGTTGPLS LNPLTGRHYG PDFPRITIRD 
MVHAQRLLLD EFGIDRIRLV VGASLGGMQV LEWGFLYPKM VQAMMPMGVS GRHSSWCIAQ 
SEAQRQAIYA DRDWNGGWYA ADCPPASGLA AARMMAMCSY RSFENFQSRF GRDVQDDGLF 
RVESYLHYQG RKLVDRFDAN TYVTLTKAMD MHDLSRGRGV YEEVLGSLQI PVEILSIISD 
VLYPKEEQEE LGRLMQHSRV IYLDEPYGHD AFLIDVEKVG RMVREFKDER AVKAHSAA