Gene Mext_4067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4067
Symbol
ID	5831646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4523172
End bp	4524335
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	69%
IMG OID	641369858
Product	hypothetical protein
Protein accession	YP_001641508
Protein GI	163853465
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.39928
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGCTC GGATACGCTC GCTTCGGACC GCTCTACTGG TTTCGGCCTT GGCGCTGACC 
CCGCTCGCCG CCGGCCTCGC TCCGATCGCG GCCATCGCCG CGCCGGCCGC CGCCTATCCC 
GGCCAGCAGG AGGGCGACCA CGTCGTCGAG AACTTCAAAT TCGCGAGCGG CGAGAGCCTG 
GATCGGGTCA AGCTGCACTA CACCACCCTC GGCACGCCGC ATCGCGGCGC GGACGGCGAG 
ATCGACAACG CGGTGCTCGT CCTGCACGGC ACCACCGGCA CGGGCAAGAG CTTCCTGATC 
CCGACGCTCG GGCCGGAGCT GTTCGGCGAA GGCGCGCCGC TCGACGCGCG GCGCTGGTAC 
GTGATCCTGC CCGACGGGCT CGGCCGCGGC GGCTCCTCGA AACCGTCCGA CGGCTTCAAG 
GCGCATTTCC CCCGCTACGG CTACGGCGAC GTCGTGGAGG GCCAGCACCG GGTCGTCACC 
GAGGCGCTCG GCGTCAAGCA TCTGCGCCTC GTGCTCGGCA CCTCCATGGG CGGGATGCAG 
GCCTGGATGT GGGGCGAGCG CTATCCCGGC GAGATGGACC TGCTGATGGC GGTGGCGAGC 
CAGCCGATCC CGGTGAGCGG GCGCAACGCC CTGTGGCGGC GCCTCCTGAT CGAGGGCATC 
CGCACCGATC CCGACTGGAA GGACGGCGAG TACACCGCGC AGCCGCGCAG CTTCGGCCGC 
ATCCTGCCGA TCTTCAACAT CATGACCGAG AGCGTGCTCG GCCTTCAGAA GCAGGCCCCG 
ACCCGCGCGG CGGCCGACAC GGCCTACGAC AAGATGATCG CCGGCTACGA GAACAAGGCC 
GACGCCAACG ATTGGCTGTA CTGGTTCGAT TCCTCCTACG ATTACGACCC CTCGCCGGAC 
CTCGAAAAGA TCACCGCGAA GGTGCTCGCG GTGAACTTCG CCGATGACGA GCTGAACCCG 
CCCCAGCTCG ACGTGATGAA CGCAGCGCTG GCGCGGGTGA AGGACGGCCG CTTCGTGCTG 
GTCCCGACCT CGCCCGAGAC GCACGGCCAT CAATCCCTGC GCTTCGCGGG CCTGTGGAAG 
GGCTACCTCG CCGAATTCGT GAGACAGCCC GAGGCGACGA CGGAGAAGGA GAGCTCGTCG 
GAGCGGCCGG AGGGCAGCCG GTAG

Protein sequence

MGARIRSLRT ALLVSALALT PLAAGLAPIA AIAAPAAAYP GQQEGDHVVE NFKFASGESL 
DRVKLHYTTL GTPHRGADGE IDNAVLVLHG TTGTGKSFLI PTLGPELFGE GAPLDARRWY 
VILPDGLGRG GSSKPSDGFK AHFPRYGYGD VVEGQHRVVT EALGVKHLRL VLGTSMGGMQ 
AWMWGERYPG EMDLLMAVAS QPIPVSGRNA LWRRLLIEGI RTDPDWKDGE YTAQPRSFGR 
ILPIFNIMTE SVLGLQKQAP TRAAADTAYD KMIAGYENKA DANDWLYWFD SSYDYDPSPD 
LEKITAKVLA VNFADDELNP PQLDVMNAAL ARVKDGRFVL VPTSPETHGH QSLRFAGLWK 
GYLAEFVRQP EATTEKESSS ERPEGSR