Gene Mlg_2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2101
Symbol
ID	4270079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2380581
End bp	2381858
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	66%
IMG OID	638126857
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_742933
Protein GI	114321250
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.881759
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.1274
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACCGG AAACCCTGGC AATCCACGCG GGCTACAGCC CGGACCCGAC CACCAAGGCG 
GTGGCGGTGC CCATCTACCA GACCACCAGC TACGCCTTCG ACAACACCCA GCATGGGGCG 
GATCTGTTCG ACCTCAAGGT GGAGGGCAAC ATCTACACCC GCATCATGAA CCCCACCAAC 
GCGGTGTTGG AGCAGCGGGT GGCCGAACTG GAGGGGGGTA TCGGCGGGTT GGCCGTGGCC 
TCGGGTATGG CGGCCATCAC CTACGCCCTT CAGTGCATCA CCCGGTCCGG TGACAATATC 
GTCTCCACCA GCAAGCTCTA CGGCGGCACC TACAACCTGT TCGCGCACAC CATGCCCAAC 
TTCGGTATCG AGGTGCGTAT GGCCAGCCAC GACGACTTTG ACCGGCTGGA GGCGCTGATC 
GATGGCAAGA CCAAGGCGGT CTTCTGCGAG ACGGTGGGCA ATCCCTCCGG CGAGCTGGCG 
GATATCGGGC GGCTGGCGGA GATCGCCCAC CGTCACGGGG TGCCGCTGAT CGTGGACAAC 
ACCGTGCCCA CGCCCTTTCT CTGGCGGCCG ATCGATGACG GCGCGGATAT CGTCGTGCAC 
TCACTGACCA AGTTCATGGG CGGTCACGGC ACCACCGTGG GCGGGGTCAT CGTGGATTCG 
GGCAAGTTCC CCTGGGCGGA CCACGGCGAA CGCTTCCCGA TGATGGTGGA GCCGGACCCG 
TCCTACCACG GGGTGGTCTA TACCGAGGCC CTGGGGCCGG CCGCCTTCAT CGGCCGCTGC 
CGGGTGGTGC CCCTGCGCAA TACCGGCGCC GCGCTCTCGC CCATGAACGC CTTCCAGCTG 
CTGCAGGGGA TCGAGACCCT GCACCTGCGC ATGGAGCGGC ACAGTGAGAA CGCCCTGGCC 
GTGGCGCAGC ACCTGCAGAA CCACCCGCAG GTGACCTGGG TGAAGTATGC CGGCCTGGAG 
TCCAGCCCGG ACGACCCGCT GGTGCAGAAG TACATGCGCG GTGGTATGGC CTCCGGCATC 
CTCTCCTTCG GTATCCGCGG GGGCAAGGAG GCCGGGGCGA AGTTCATTGA TGCCCTGCAA 
CTCATCACCC GCCTGGTGAA CATCGGTGAC GCCAAGTCGC TGGCCACTCA TCCGGCCACC 
ACCACCCACC GCCAGTTGAA CGAGGCGGAG CTGGAGCAGG CGGGGGTCAG TCAGGACATG 
GTGCGCATCG CGGTGGGCAT CGAGCACGTG GACGACATCA TCGCGGACAT CGACCAGGCC 
CTGGAGGCCG CAAAATAG

Protein sequence

MKPETLAIHA GYSPDPTTKA VAVPIYQTTS YAFDNTQHGA DLFDLKVEGN IYTRIMNPTN 
AVLEQRVAEL EGGIGGLAVA SGMAAITYAL QCITRSGDNI VSTSKLYGGT YNLFAHTMPN 
FGIEVRMASH DDFDRLEALI DGKTKAVFCE TVGNPSGELA DIGRLAEIAH RHGVPLIVDN 
TVPTPFLWRP IDDGADIVVH SLTKFMGGHG TTVGGVIVDS GKFPWADHGE RFPMMVEPDP 
SYHGVVYTEA LGPAAFIGRC RVVPLRNTGA ALSPMNAFQL LQGIETLHLR MERHSENALA 
VAQHLQNHPQ VTWVKYAGLE SSPDDPLVQK YMRGGMASGI LSFGIRGGKE AGAKFIDALQ 
LITRLVNIGD AKSLATHPAT TTHRQLNEAE LEQAGVSQDM VRIAVGIEHV DDIIADIDQA 
LEAAK