Gene Clim_0668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0668
Symbol
ID	6354282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	740570
End bp	741859
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	57%
IMG OID	642668295
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_001942730
Protein GI	189346201
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTCAA ACCACTACCG TTTCGAAACG CTTGCCCTGC ATGCAGGGCA GCCTGTCGAT 
CAGACACAGT CCCGCGGCAT CCCGGTGTAC CGCACCAGTT CCTACATCTT CAAAAACACG 
AAACATGCGG CGAACCTGTT TGCCTTGAAG GAACTGGGCA ACATCTATAC CCGACTGATG 
AACCCGACCA CAGATATCCT GGAACAGCGC ATAACGGAAC TTGAAGGGGG AGCCGCATCC 
GTTGCGCTCG CATCGGGCAC GGCGGCAATC TTCAATGCCG TCATCACGCT GGCGGAAGCC 
GGGGATGGCA TCATTGCCGC CAACAATCTC TACGGCGGCA CCTATACCCA GTTCGACGCC 
ATTCTGCCTA AACTCGGCAT CGATGTCACC TTCGTCGATC CGCATAAACC GGAAAACTTC 
GAGCGGGCGA TAACGGAAAA AACAAGGGCG ATCTTCATCG AAACGATCGG CAACCCCGCT 
CTGGATTACA CCGGGGTAAA AGCCGTCGCC GATGTCGCCC ACCGTAACGG GCTCCCCCTG 
ATCGTCGACG CAACGTTCAC GACCCCATAC CTTTTGAGAA CAATAGAACT TGGAGCCGAC 
ATCGTGGTCA ACTCCCTGAC AAAATGGATA GGAGGACACG GCGCAGCGGT GGGAGGAAGT 
ATTACCGATG CCGGACGTTT TGACTGGAAA AAAGGTCGCC ATCCTCTCTT TACCGAACCG 
GACGACAACT ACCACGGACT CCGCTGGGCG CTCGACCTGC CCGAGCCGCT CGCTGCGATA 
GCCTTCGCCC TCAGGGTACG CACCGTACCG TTAAGAAACC TTGGATCGTG CATTTCGCCC 
GACAATTCAT GGATATTCCT CCAGGGTCTC GAAACCTTGC CGGTGCGCAT GGCGCGGCAT 
TGCGAAAACG CACTTTACGT GGCAGAATAT CTCGAACACC ATCCCAACGT GGCATGGATT 
CGCTATCCAG GCCTGAAAAA CGACACGTCC CATGCCGCAG CTTCGAAAGA CCTGAAAAAA 
GGGTTCGGAG GCATGGTGGT GTTCGGCGTA AAAGGAGGAT ACGATGCCGC CGTCCGGCTT 
ATCGATTCCA TCGGCCTCTT CTCGCACCTT GCCAACGTCG GTGACGCAAA AAGCCTCATC 
CTGCATCCGG CAAGCACCTC CCACAGCCAG TTGTCCGAAG AACAGCAGCG GCAGGGCGGA 
CTCTCTCCGG AACTGATACG CCTCTCCATA GGGCTCGAAC ATCCCGACGA CCTGATAGAG 
GCACTCGATA ACGCGCTTCA ACCCTTGTAA

Protein sequence

MSSNHYRFET LALHAGQPVD QTQSRGIPVY RTSSYIFKNT KHAANLFALK ELGNIYTRLM 
NPTTDILEQR ITELEGGAAS VALASGTAAI FNAVITLAEA GDGIIAANNL YGGTYTQFDA 
ILPKLGIDVT FVDPHKPENF ERAITEKTRA IFIETIGNPA LDYTGVKAVA DVAHRNGLPL 
IVDATFTTPY LLRTIELGAD IVVNSLTKWI GGHGAAVGGS ITDAGRFDWK KGRHPLFTEP 
DDNYHGLRWA LDLPEPLAAI AFALRVRTVP LRNLGSCISP DNSWIFLQGL ETLPVRMARH 
CENALYVAEY LEHHPNVAWI RYPGLKNDTS HAAASKDLKK GFGGMVVFGV KGGYDAAVRL 
IDSIGLFSHL ANVGDAKSLI LHPASTSHSQ LSEEQQRQGG LSPELIRLSI GLEHPDDLIE 
ALDNALQPL