Gene Nmul_A0221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0221
Symbol	metX
ID	3784598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	235602
End bp	236735
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	54%
IMG OID	637810293
Product	homoserine O-acetyltransferase
Protein accession	YP_410921
Protein GI	82701355
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCATGC AAGATTCGAA TTCATTCAGT ACTGTTACTC CACAGGTGGC GCGTTTTGAC 
ACGCCTTTGC ATTTGAAAAG CGGCGCGGTG CTCGACAGCT ACGAGCTGGT GTACGAAACA 
TACGGGGAGC TCAACGCGGC GCGGTCGAAC GCCGTACTGG TATGCCACGC CCTTTCAGGG 
AATCATCATC TCGCAGGCCT TTACGACGAT AACCCCAAGA GTGCCGGCTG GTGGAACAAC 
ATGATCGGGC CGGGCAAATC GATCGATACC CAGAAATTTT TCTTAATCGG GGTAAACAAC 
CTGGGCGGTT GTCATGGATC CACCGGACCG GCGAGTATTG ATGTCAGGAC TGGAAAGTGT 
TACGGCCCGA ATTTTCCGGT TGTGACAGTG GAAGACTGGG TTCAGACACA AGTCCGCCTT 
GCCGATTATC TGGGTATCGA TCAGTTTGCC GCCGTGGCTG GCGGTAGTCT TGGCGGAATG 
CAGGCTTTGC AGTGGACACT TGATTTTCCC GAGAGGGTGC GCCACGCGCT GGTTATCGCC 
GCGGCTGCAA AGTTGACTGC GCAGAACATC GCATTCAACG ATGTGGCACG CCAAGCTATC 
ATTACCGATC CTGATTTCCA TGGCGGCGAC TATTATTCAC ACGGTGTCAT TCCGCGGAGA 
GGATTACGCC TGGCGCGCAT GCTGGGACAT ATCACCTACC TCTCGGACGA CTCGATGGCG 
GCTAAATTCG GCCGGGAACT GCGGAATGGA GCGCTTGCCT TCGGTTACGA CGTGGAGTTC 
GAAATAGAAT CGTATCTTCG TTATCAGGGA GATAAATTCG CTAGCCAGTT CGATGCGAAC 
ACGTATCTGC TGATGACAAA GGCATTGGAC TATTTTGATC CTGCCTTTCC GCACAACAAC 
GACCTCAGCG CCGCATTCCG ATTCGCCAGG GCTAATTTCC TGGTGCTGTC GTTTACTACC 
GACTGGCGTT TTTCCCCGGA GCGCTCGCGC GCCATCGTAA GGGCGCTGCT GGACAACGAA 
CTGAACGTCA GTTATGCCGA AATTACATCC AGTCATGGCC ACGACTCGTT CCTCATGGAG 
GATCGGCATT ATCACAGGCT GGTGCGGGCT TACATGGATA ACGTGGTCGT ATGA

Protein sequence

MLMQDSNSFS TVTPQVARFD TPLHLKSGAV LDSYELVYET YGELNAARSN AVLVCHALSG 
NHHLAGLYDD NPKSAGWWNN MIGPGKSIDT QKFFLIGVNN LGGCHGSTGP ASIDVRTGKC 
YGPNFPVVTV EDWVQTQVRL ADYLGIDQFA AVAGGSLGGM QALQWTLDFP ERVRHALVIA 
AAAKLTAQNI AFNDVARQAI ITDPDFHGGD YYSHGVIPRR GLRLARMLGH ITYLSDDSMA 
AKFGRELRNG ALAFGYDVEF EIESYLRYQG DKFASQFDAN TYLLMTKALD YFDPAFPHNN 
DLSAAFRFAR ANFLVLSFTT DWRFSPERSR AIVRALLDNE LNVSYAEITS SHGHDSFLME 
DRHYHRLVRA YMDNVVV