Gene Msil_1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1023
Symbol
ID	7091851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	1109882
End bp	1111066
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	64%
IMG OID	643464362
Product	homoserine O-acetyltransferase
Protein accession	YP_002361354
Protein GI	217977207
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.00432777
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGACGATCG TCTTGACCCA TAAGCTCAGC GGCCTGCGCG AAGTCGACGC GCCGCATAGT 
CTCGTCGCGC ATTTCGGACC AGATCACGCG CTGCAGATGG ATTCGGGCGG CCGGCTCAAT 
CAATGGACGA TCGCCTATCA GACCTATGGC GAACTCAACG CCGCCAAATC CAACGCCATT 
CTCGTCTGCC ATGCTCTGAC CGGCGATCAG CATGTCGCCA ACGCGCATCC GGTAACGGGC 
AAGCCCGGCT GGTGGAGCAC CATGGTCGGT CCCGGCCGGC CGATCGACAC CGATCGCTAT 
TTCGTCATCT GCTCGAATGT GATCGGCGGC TGCATGGGCA CGACCGGTCC GGCCTCGCTC 
AATCCGCAGA CAGGCCGGCC GTACGGGCTT GAGCTGCCGA TCGTGACGAT CCGCGACATG 
GTCCGGGCGC AGGCGATGCT GATCGACCAC CTTGGCGTCG ATACGCTGTT TTGCGTCGTC 
GGGGGCTCGA TGGGCGGCAT GCAGGTGCTG CAATGGGTTG CGAGCTTCCC CGAGCGCGTC 
TTCTCGGCCA TGCCGATCGC CACGGCGGCG AAACATTCCT CGCAAAACAT CGCCTTTCAC 
GAGGTCGGCC GGCAGGCCGT GATGGCCGAT CCCGACTGGC GCAAGGGCCG CTATCTCGAG 
GAAGGGGTCA TCCCCACCAA AGGCCTCGCC GTCGCCCGCA TGGCGGCGCA TATCACCTAT 
CTGTCCGACG AGGCGCTGCA GAGCAAATTT GGCCGCAAGC TACAGGACCG CGACGCGCCG 
ACCTTCTCCT TCGACGCCGA ATTCCAGATC GAGAATTATC TGCGCTATCA GGGCTCGAGC 
TTCGTCGACC GGTTCGATCC GAACTCCTAT CTTTATGTGA CCCGAGCTTG CGACTATTTC 
GACCTGGCCG CCGACTACGA CGGATCGCTG GCGCGCGCCT TTCAGGGGGT CAAGGCGCGC 
TTTTGCGTCG TCTCGTTCAA TTCCGACTGG CTCTATCCGA CCGCCGCCTC GCGCGCCATC 
GTGCACGCCC TGAACGCCGG GGGCGCCTCG GTCTCCTTCG TCGACATCGA GACCGATCGC 
GGCCACGACG CCTTTCTGCT CGACCTGCCG GAGTTCATCG CCACCTCGCA GGGCTTTCTC 
GATTCGGCCG CCAAGGCTCG CGGCCTGCCG CCGGCCGCGC CTTGA

Protein sequence

MTIVLTHKLS GLREVDAPHS LVAHFGPDHA LQMDSGGRLN QWTIAYQTYG ELNAAKSNAI 
LVCHALTGDQ HVANAHPVTG KPGWWSTMVG PGRPIDTDRY FVICSNVIGG CMGTTGPASL 
NPQTGRPYGL ELPIVTIRDM VRAQAMLIDH LGVDTLFCVV GGSMGGMQVL QWVASFPERV 
FSAMPIATAA KHSSQNIAFH EVGRQAVMAD PDWRKGRYLE EGVIPTKGLA VARMAAHITY 
LSDEALQSKF GRKLQDRDAP TFSFDAEFQI ENYLRYQGSS FVDRFDPNSY LYVTRACDYF 
DLAADYDGSL ARAFQGVKAR FCVVSFNSDW LYPTAASRAI VHALNAGGAS VSFVDIETDR 
GHDAFLLDLP EFIATSQGFL DSAAKARGLP PAAP