Gene Mlab_1670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_1670
Symbol
ID	4796062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	+
Start bp	1703788
End bp	1705026
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	53%
IMG OID	640100360
Product	TPR repeat-containing protein
Protein accession	YP_001031098
Protein GI	124486482
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00502897
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00000000193878
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCCATC ATCACGAAAA ACCGCCGAAA ACGAAATCGG CGAAGTACAT TACCATCGGG 
CTCATCACCC TCACGGTCAT CATGTTCATC GTCGCATTCC ACCCGTTTGG CACGATCATT 
ACCACGCCGT TTCCAAAAGA CGAAGTGATC ATCGCGGTTT CCATGCCGTT TGAAGGAGAA 
ATGGCAGAGT TCGGCATCGA ATATATGCGG GGAATCGAAC TCGCGGTCGA AGACATCAAT 
GATGAAGGCG GCATCCGGGG CGTCCCGGTC CGGGTCGAAT ACTACAACAA CAAAGGAAAC 
GTCACGCTCG CAAAAGCCCA GTTCAAAGCG ATCAAAGAAA GCGGAGTCCC AGTTGTGATC 
GGCGCATTGA CAAGCACAGT GACGCTTGCC CTTGCCCCGT ATGCGGAGTC ATACGAGATC 
GTTCTTATCT CTCCATCGGC AACATCTGCC GGTCTCTCGG CATACGGCAA TTACGTATAT 
CGAACGGTCT CTTCCGACTT CTATCTCGGC GCCGGCATGG CGAAGATCAT CGGCGGCAGA 
AACGAAACGC AGAATGTGAT GATGATAAGT CTCGACAACA GTTACGGAAA AAGTCTCAAA 
TACGCCTTCA TGAACGAAGC CAACAGTTCC TATCCGGATA TGCATATCGT CTCCGCCATA 
TCGGTCCCCG ACTCTAATAC GGTGAACACG ACCGAGATCA TTGCCGAAAT GAAGAAAACC 
GACCCCCAGT CCGTTCTGCT GATCGTAAAC CCGAGCCAGT GCATAGAGAT CATGCTGGCC 
GCAGAAAAGG AGGGACTCGA CCCGACCTGG TTTGGCTCGG ACATGGTGAC CAACCGGCAG 
GTCCCTCAGG AAGTCGGTGA ATACTCGGAA GGCCTCATCG GTTTTTCCCA GGCGAGAAGG 
ATCTCCGACC CCTCATACGA AGAGCATTAC GAAGAAACCT TCGGAGAAGC GATGATGACC 
CGCGACTCGA TCTACGGATA CGACACGATG ATCGTGGTGT CCCAGGCAAT CGAACACAGC 
GGATACACGG CGGACGGCAT CAGGGAAGGT CTCGACCTGA TCAGACATGT CGGCCTTACC 
GGAACGATCG TCTTCGACGA AAAAGGAGAT GCCTATCCGT CGTATGATGT TATGCGGCTT 
CAAAACGGCA AATGGGTCGA TCTACCGTGG AGAGAGGTCC TGACCTTCGA GAAGAAAGCG 
GCTGCGATAT CCTCGGCTCA CGGCACCTCC TCCCACTGA

Protein sequence

MSHHHEKPPK TKSAKYITIG LITLTVIMFI VAFHPFGTII TTPFPKDEVI IAVSMPFEGE 
MAEFGIEYMR GIELAVEDIN DEGGIRGVPV RVEYYNNKGN VTLAKAQFKA IKESGVPVVI 
GALTSTVTLA LAPYAESYEI VLISPSATSA GLSAYGNYVY RTVSSDFYLG AGMAKIIGGR 
NETQNVMMIS LDNSYGKSLK YAFMNEANSS YPDMHIVSAI SVPDSNTVNT TEIIAEMKKT 
DPQSVLLIVN PSQCIEIMLA AEKEGLDPTW FGSDMVTNRQ VPQEVGEYSE GLIGFSQARR 
ISDPSYEEHY EETFGEAMMT RDSIYGYDTM IVVSQAIEHS GYTADGIREG LDLIRHVGLT 
GTIVFDEKGD AYPSYDVMRL QNGKWVDLPW REVLTFEKKA AAISSAHGTS SH