Gene Mchl_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_1971
Symbol
ID	7116787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	2043229
End bp	2044653
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	50%
IMG OID	643524724
Product	hypothetical protein
Protein accession	YP_002420750
Protein GI	218529934
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.985028
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTGTT CATGGTACGC CGGGAAAGGC CTGGAATCGA TTGCCTCCTT TTTTGCAATC 
ATGTTTCTCT CGTTTTCTGC CAATGCGCTT GCACCGGGAA AACAAACCCT CGAAGCGCTC 
GCCCGCAACG CGCGCTCCGA TCAGCCCTAT GCTGTGGTTA TATCGCCCAA CTCAAGGGAG 
AATGTTCGTA ACAGGCAGCT AGAAGCTGAT AGCTATACTC AGCGCCTTCG AGAACTTGGT 
TTCGCAGTCA CCACAATTGG ACCATCCCGC AGATTCGATG CAGATGCCGC AATCCGCGAT 
CTTGCCAATA TTCCGAGGGG GTCCAACGTA GCTGTTGTTG TTCCTGCGCC CGCCTATGCC 
GATGCGGATG ACATATTTAT CCTTGCTCAA GATAGTGCGG AAACCGCAAC AAATGATACA 
ACATCTATGG CTAGCGAGGC GCTTTCTCTG AGTTTTCTAT CCCGTGCAAT TAGTAAGAGC 
AGACCGACGC AATTTATTGT GTTGATACCT CATTGTCGCC GCGTGGACAA TCCACAAGCA 
TTGTGTCCAG CAGAGTCCTT GGCTCGGTCA GGTGGTGCAA GTGTTATCGC TGCAAATAAT 
TCGAACCTTG AGACGGACTG GGAGGGGATT TCTTACGACA AGATACTGCC GCTAATGACA 
CAAGAGGGGC TTACCTACGC CGCTTTATAC AACCGAATTA GCGCGGCAAC CACAGGCGCG 
GGCATCACGA TGAGCCGGTC GCTCAATTTA TCAACTGAAT TCATGTTTGC GCCACTGAAT 
TTTTTTCAAA ATATCAGTAC GCCATGCAAT AGTAATCGCA CCGGCGCGAT ATCCCTTACA 
TTAGCAAGGG CAAGAGTGTC GGCATGTGAA ACCGCTGTAG CGACATGGCC GTATGCAAGG 
GAATTTGTGC AAGCGCATGA ATTTGCATTG GAGCAACTTG CTTTTGCTGA GACGGAGACA 
TTCTGCGGTC CGTTACTTCA ATCATCATTG GCAGTCTATC GAGAACGATA TCCGGCGGGG 
TCATTTATTT CTCAGATTGA ACGGCGGCTT ACCGATTGCG AAAAACGCCG AGTGGAAAAG 
GGGCGGCAAA AGGATCGCGA GGCTGAGAAC GTGCGTAGGC AAGATCGAAA ACAGAATCAA 
GCAGATCAAC CTCAACTCGA CAGTCGAACA TCGTCCAACG TTGGCAGTTG GTTTGTTATC 
ATGGGTTCGT ATCCTTCGGC CGAGCGTTTC AAAGCAGTGG CAAAGCAGAA TTGGCTGGAC 
GCGCAAGGCA TAAACGCTCA GCTCATCGCC ACAAATAACT ATCCAGGCCT AACATCCGGA 
TTAACTATTG TTAGCCAAGG GCCCTACTCG AAGGATGTAG CACAGCGGCG ATTAAACCAA 
GTAAAATCGG TCGCTCGCGA TGCTTATATC AAGTCTGCAT ATTAA

Protein sequence

MLCSWYAGKG LESIASFFAI MFLSFSANAL APGKQTLEAL ARNARSDQPY AVVISPNSRE 
NVRNRQLEAD SYTQRLRELG FAVTTIGPSR RFDADAAIRD LANIPRGSNV AVVVPAPAYA 
DADDIFILAQ DSAETATNDT TSMASEALSL SFLSRAISKS RPTQFIVLIP HCRRVDNPQA 
LCPAESLARS GGASVIAANN SNLETDWEGI SYDKILPLMT QEGLTYAALY NRISAATTGA 
GITMSRSLNL STEFMFAPLN FFQNISTPCN SNRTGAISLT LARARVSACE TAVATWPYAR 
EFVQAHEFAL EQLAFAETET FCGPLLQSSL AVYRERYPAG SFISQIERRL TDCEKRRVEK 
GRQKDREAEN VRRQDRKQNQ ADQPQLDSRT SSNVGSWFVI MGSYPSAERF KAVAKQNWLD 
AQGINAQLIA TNNYPGLTSG LTIVSQGPYS KDVAQRRLNQ VKSVARDAYI KSAY