Gene Mlab_1649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_1649
Symbol
ID	4795469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	1676925
End bp	1677998
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	56%
IMG OID	640100334
Product	chorismate synthase
Protein accession	YP_001031077
Protein GI	124486461
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0108012
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCGAA TCGGAGAATC AATAACGCTC ACGTTGTTTG GGGCGAGTCA CGACAGTCGT 
ATCGGCTGTG TTATAGACGG AATTCCTCCG GGCTATCCTG TAAACGTTGA GAGTATCACT 
GCAGATCTCG AGCTTAGAAA ACCATCCGCC GGTATCGGAA CTCCGCGGGT GGAGGCGGAT 
GTTCCTGAGA TCTCCGGTAT TGTGGATGGA ATCACTACGG GCTGTCCGGT CGTGATTACT 
TTTTCAAACA GCAATACCCG GAGTTCGGAT TATGAACAAC TCCGCCGCAT CCCCCGTCCG 
GGCCATGCCG ATTACCCTGC GGTATCAAAA TTCGGTCCGG CTCATGACAT CCGTGGCGGC 
GGGATGTTTT CCGGCAGAAT GACGACTCCC CTTGTTGCGG CTGGTGCTCT CCTCCGTGAT 
CTGATCGGCA GTTTGGGAAT CTCCGTCGGC TCGTATGTTA CCCGGATCGG CAGCGTCGTC 
GATACAAATA CCTACGATCC TGCCGATGTG CTGACGAGAT CGCGGACAAA TCCGCTTCGT 
GCCATGTCTT CGGGCATCGA GGATCGGATG AGAGCCGAGA TCCTCGTGGC GAAATCGGAT 
GGAGACAGTG TCGGCGGGAT CGTTCGGTGC TTTGCGACAG GTCTTCCGGC TGGTCTTGGA 
GAGCCTTTCT TCGACACGCT CGACGGCGAG ATATCTAAAG CGGTTTTCGC CATTCCCGGC 
GTGAAAGCCA TCGGATTTGG CGAGGGGTTC GCCGCCGCTG GCCTTCGCGG ATCCGAAAAC 
AACGATGCCT ACCGTATTCA AAATGGGTCT GTCGTCACGC TGACGAATCA TGCGGGCGGC 
GTCCTTGGCG GGATGTCGAG CGGCGCTGTT CTGGATTTTT CCGTGGCATT CAAGCCGACC 
CCGTCTATTG CAAAACAGCA GATGAGTGTT GATCTGCTGA CCCGCGAAGA CGCCGAACTT 
TCAGTGAAAG GACGCCACGA TCCGTGCATT GCGAATCGGG GAGCGATCGT AGTCGAAGCG 
ATGACCGTGT TCACGCTTGC GGATCTCGCA CTCAGAGGGG GATTTCTTGT CTGA

Protein sequence

MNRIGESITL TLFGASHDSR IGCVIDGIPP GYPVNVESIT ADLELRKPSA GIGTPRVEAD 
VPEISGIVDG ITTGCPVVIT FSNSNTRSSD YEQLRRIPRP GHADYPAVSK FGPAHDIRGG 
GMFSGRMTTP LVAAGALLRD LIGSLGISVG SYVTRIGSVV DTNTYDPADV LTRSRTNPLR 
AMSSGIEDRM RAEILVAKSD GDSVGGIVRC FATGLPAGLG EPFFDTLDGE ISKAVFAIPG 
VKAIGFGEGF AAAGLRGSEN NDAYRIQNGS VVTLTNHAGG VLGGMSSGAV LDFSVAFKPT 
PSIAKQQMSV DLLTREDAEL SVKGRHDPCI ANRGAIVVEA MTVFTLADLA LRGGFLV