Gene Mchl_0078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_0078
Symbol
ID	7114002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	74139
End bp	75338
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	65%
IMG OID	643522892
Product	hypothetical protein
Protein accession	YP_002418962
Protein GI	218528146
COG category	[R] General function prediction only
COG ID	[COG4469] Competence protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.698048
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCATCC ATACGGTAGG TCACATGGTT GAAGGTGCCG TCCGGGCCTA CACGCGGGAG 
GGGCTGCTCT TCGGTGAGCG ACCAAATGGC AGCATCGTCC ATATCTCCGA GGTGCCCTCC 
GGTCTTGCCT GCGACTGCCG ATGTCCGAAC TGCGGGACAC CGCTGGTTGC TCGTAGAGGC 
GAGCAGCTGG GCCATCACTT CGGACACCAT AATACCGTGG GCGAGCGCGC CTGCGCGGGG 
GGACCGGAGA CCGCGCTGCA CCGCTTTGCC AAGGAGTTGC TCGCAGCCAA ACTCGCGCTC 
GTTCTCCCGC CCCTGTACCG GAATGGTGAG GGAAAGGCTC GCTACGCTGG CGGCTTCCAT 
CGGTTCGACG CTGCGCTCCT CGAACACCGG CTCGGTGCCA TTGTTCCGGA CGTGATTGTC 
CGCCGGGCGG ACCGGGATCT GCTTGTCGAG TTCCACGTCA CCCACGCCTG TGACGCTACC 
AAGATCGCCA AGATCGCGAG CCTTGGCACA GCTGCGATCG AGGTTGATCT TTCCGGTTTG 
GCACTGAACG CACCACGGGC TGAGCTTGAG GCGGCCATCC TCGAACGTGC TCCCCGCCGT 
TGGCTGCACA ACCCGAAGCT CGGCTGGGTT GGGGGTATTC ACGGCCCGGT GACGACCAGG 
ATCACGCCAG CGTCGTCTCG ATCCCTCACT GCTCTGGAGA AAGCCTACGC GTCGGCCTAC 
CGCGAGGCAC TCTCGACTCC GAGCCGTAGC CTCGCTCGGC ATCGCGTTGA GGCTGACGGC 
CTCGTACGCA CGATCGGCGT CGAGGTTGCC GGGATCGGGT GCTTCACGGC CTCACCTCGT 
GATTGGCAGG CAGTCATCCT CTTGAACGCG CTTGAAGGCG CCCTGGTTGG CCGCAGCAGC 
ATCGTGAGTG CCAAGGCGGC TCTGCAGCAG ATCCGCGAGC GCGGCTGGCT CCGGCCCCGC 
TTTAGCCGCC TCCCACCAGC AGAGGCGAAG GCGCTATCCG CGGCACTGCC CTCGTATGCC 
TCCCCTGCCG ATGCAATCAC AGCCTGGGCA ATGACACTGT CTCGGGAAGG CATCCTTGTC 
CCGAGCAGTG CGCGCGGTCA GTGGGTGATC CGGCGCGAGA CGTTGCAGCG CGTTCGCGAA 
GCACGACAAC AAAAGGAAGC TCGGCCGAGT AGCAGGTCCG GCCCAGCCGA TCCCACTTAA

Protein sequence

MSIHTVGHMV EGAVRAYTRE GLLFGERPNG SIVHISEVPS GLACDCRCPN CGTPLVARRG 
EQLGHHFGHH NTVGERACAG GPETALHRFA KELLAAKLAL VLPPLYRNGE GKARYAGGFH 
RFDAALLEHR LGAIVPDVIV RRADRDLLVE FHVTHACDAT KIAKIASLGT AAIEVDLSGL 
ALNAPRAELE AAILERAPRR WLHNPKLGWV GGIHGPVTTR ITPASSRSLT ALEKAYASAY 
REALSTPSRS LARHRVEADG LVRTIGVEVA GIGCFTASPR DWQAVILLNA LEGALVGRSS 
IVSAKAALQQ IRERGWLRPR FSRLPPAEAK ALSAALPSYA SPADAITAWA MTLSREGILV 
PSSARGQWVI RRETLQRVRE ARQQKEARPS SRSGPADPT