Gene Mlab_1424 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_1424
Symbol
ID	4795641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	+
Start bp	1453931
End bp	1455016
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	52%
IMG OID	640100110
Product	hypothetical protein
Protein accession	YP_001030857
Protein GI	124486241
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02622] CDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0353322
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTTTG ACGCATTTAA CGGGAAAACT GTCCTCGTAA CAGGTCACAC TGGATTCAAA 
GGCTCATGGC TGTGTCTCTG GCTCGCACAA CTGGGCGCAG AAGTGCATGG CTTCTCTCTC 
CCGCCAAACA CAGAACCAAA CCATTACACT GCGGCCCACA TCTCCGAACT CCTGAAATCG 
GAACAGTTGG GTGACATCAG AGACCAAAGC ACGCTAACGA AGTACATCCA AAGCGTACAG 
CCGGACTGCA TATTCCATCT GGCAGCGCAG CCGCTCGTCA GAAAATCATA TGCCAACCCC 
GTAGATACAT TCGATACAAA CGTTATGGGC AGCATCTATC TGATGGATGC GGTGCGAAGT 
CTGGGTAAAC CATGTTCGGT AGTGATGATC ACAAGCGACA AATGCTATGA GAACGTGGGA 
AAAGCCGAGG GCTATGTCGA GACCGATCCG ATGGGCGGTC ATGATCCCTA CAGCGCAAGC 
AAAGGCTGCG CCGAACTCGC CGTTGCTTCA TACCGCCGCT CCTTTTTCCC GCCTGCAGAT 
GTCGCAAAGC ATGGAGTGAT GATCGCCTCG GTTCGGGCAG GTAATGTTGT CGGCGGCGGA 
GACTGGGCAG AGGACAGGAT TATTCCTGAC GCCGTGCGTG CAGTTACCAC GGAAAAATCT 
CTGGAGATCA GGAGTCCTAA CGCCGTCCGC CCCTGGCAGC ACGTGCTGGA GCCGCTCTCC 
GGATATATGC TTCTTGCGGC AAAGATGATG GAGACGAATG CAGCTGTTTA TGCTGACGGC 
TGGAACTTTG GCCCGAAAGA GAACAGCCCC GCAGTCACGG TCGCCGAAAT CATCGACAGC 
TTCTATAATG TATGGCGAAA AGGAAAAGCA GAATATGATA CAGAGACGAA GCATCTGCAT 
GAAGCTGCGT TCCTGACGCT CTCCTCAAAG AAAGCTGAGA GCGTTCTTGG CTGGAAACAG 
CAGTGGGACG TCAATGAGAC GATGAAGAAA ACTGCCGAAT GGTATAAGAA TTTTTATGCC 
GGAGCAGATG CCAGAGAACT CAGTCTGGCA GATATCACCG CCTATATGAA TCACCTGGAG 
TATTGA

Protein sequence

MIFDAFNGKT VLVTGHTGFK GSWLCLWLAQ LGAEVHGFSL PPNTEPNHYT AAHISELLKS 
EQLGDIRDQS TLTKYIQSVQ PDCIFHLAAQ PLVRKSYANP VDTFDTNVMG SIYLMDAVRS 
LGKPCSVVMI TSDKCYENVG KAEGYVETDP MGGHDPYSAS KGCAELAVAS YRRSFFPPAD 
VAKHGVMIAS VRAGNVVGGG DWAEDRIIPD AVRAVTTEKS LEIRSPNAVR PWQHVLEPLS 
GYMLLAAKMM ETNAAVYADG WNFGPKENSP AVTVAEIIDS FYNVWRKGKA EYDTETKHLH 
EAAFLTLSSK KAESVLGWKQ QWDVNETMKK TAEWYKNFYA GADARELSLA DITAYMNHLE 
Y