Gene Mlab_1650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_1650
Symbol
ID	4795407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	1677995
End bp	1679263
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	54%
IMG OID	640100335
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001031078
Protein GI	124486462
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0113989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTTA TCGTATCTCG TTCTCAAATC TCCGGATGTG TCCATGCACC TCCCTCAAAA 
AGTCACACAC ACCGGGCATT TCTCCTTGCG TCTCTTGCAA AAGGAGAATC GGTCGTTCTC 
TCTCCGCTTC TGGGCGAGGA CACTCTGGCT ACTCTCTCCG CGGTCAAAGC GCTTGGAGCG 
AACGTATGCG AAGGGGATGA TCGAATCACG ATCCAGGGCG GCAATTTACA CGCCCCGCTC 
CCGAAAGGAA CGGTGATAAA CTGTAAAAAC TCGGGCACCT CCATTCGGAT GCTTGCAGGC 
ATAGCTTCCC GTCTGGATGG AACGACTGAG TTCACGGGTG ACGCTTCGCT CTGTTCCCGC 
CCTATGAAGC CTCTGCTTGA CGCCCTGTCA GAACTTGGAG CCGGGGTAAC ATCCGACAAC 
GGATGTGCTC CGTTCACCAT AACGGGTCCG GTATCGGGCG GCGATGTCCA TATTCGCGGT 
GACGTGAGTT CTCAATTCAT CTCCGGCCTG CTGATCTCTG CTCCGCTTGG CAAAGCTGAC 
ACGAGGATCC ACCTGACAAC TCCCCTCACG TCAAAACCAT ACGTGGACAT GACGATTTCT 
GCTATGAAAA AGCACGGCGT TTCGGTCGAG ACGATCGAAG ATGGATATCT TGTCCGTTCA 
GGTCAGGTCT ATTCTTCCGA GGATGTTCAG GTTGGCGGCG ACTACTCGTC GGCCGCATTT 
CTGTTTGCGG CGGCGGCACT CGCCGGGGAG ATCGCCGTTT CCGGACTCGA CCCGGCTGAC 
CCTCAGGGCG ATCAGGTTGT GATCTCCATC CTTGAAACAT TCGGGGCAGG AGTAGTTCGT 
GATGGCGAAA ACGTTACGAT TCGAAAAGCA GCTTTGAAGG CTGCAGACAT CGATCTTGCG 
AACGCTCCGG ATCTGTTTCC CATTATCGCG GTCCTTGCGT CGCAGGCGAA AGGCACCAGC 
AGATTATACG GCGCCGCTCA TCTCAGATTC AAGGAAAGCG ACCGTATCAT GTCCACGGTC 
CTTTTCCTCA GATCGATGGG TGCAGATATC AGCGAGACTG AGGATGGATG CATTGTTACG 
GGACCTGCCA ATCTTTCCGG GGCAAATGTT ACTACATTTG GCGACCACCG TATAATGATG 
GCATCAGCGG TTGCCGGGCT TATCGCAGAT AGTACTACGA CCGTAGATGA TGCCGGCTGC 
TGCGCAGTTT CCTATCCGGG TTTTGTGAAA GATATGCAGA AACTCGGTGC GGATATGAGG 
GAAGAATGA

Protein sequence

MKLIVSRSQI SGCVHAPPSK SHTHRAFLLA SLAKGESVVL SPLLGEDTLA TLSAVKALGA 
NVCEGDDRIT IQGGNLHAPL PKGTVINCKN SGTSIRMLAG IASRLDGTTE FTGDASLCSR 
PMKPLLDALS ELGAGVTSDN GCAPFTITGP VSGGDVHIRG DVSSQFISGL LISAPLGKAD 
TRIHLTTPLT SKPYVDMTIS AMKKHGVSVE TIEDGYLVRS GQVYSSEDVQ VGGDYSSAAF 
LFAAAALAGE IAVSGLDPAD PQGDQVVISI LETFGAGVVR DGENVTIRKA ALKAADIDLA 
NAPDLFPIIA VLASQAKGTS RLYGAAHLRF KESDRIMSTV LFLRSMGADI SETEDGCIVT 
GPANLSGANV TTFGDHRIMM ASAVAGLIAD STTTVDDAGC CAVSYPGFVK DMQKLGADMR 
EE