Gene Mchl_5049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_5049
Symbol
ID	7118840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	5400013
End bp	5402052
Gene Length	2040 bp
Protein Length	679 aa
Translation table	11
GC content	72%
IMG OID	643527743
Product	hypothetical protein
Protein accession	YP_002423742
Protein GI	218532926
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.326897
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.417986
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCTCG GCCCGCTGCG GAGCGCGGCG GCGTTCCTCG CCGCCGTCCT CATCGGATCG 
CCGCTCTTCG GCTTCACCGC GGCGGTTCGG GGCGGCGAGG CGAAAGCGCC GCTGGTCCTG 
CGGGTTGCGC CCACCGGAGA CAAAGCCCCC CGTCGCGACG CCCGCTTCGC GGATCTGCCG 
CGGGCGCTCG CATACGTCGC CGCGCTGCGC CGTCAGGGGG AGGCGCGGGC GATCGTCGTC 
GAGCTGGAAC CCGGAACGCA CCGGATCTCG GCGCCCGTCC GGATCGGCCC CCACCATGCC 
GGCACGGAAG GGGCGCCCCT GATCCTGCGC GGGGCCGACG ACGGATCGAG CCGGCTCGTC 
GGCAGCGTGC CCCTCACGCC CGCATCGCTG CCGCCGCGCC TGCGCGCGCG GTTGCCCGCC 
TCGGCCCGCG GCGCAGTGCG CGCCTACCAA TTGCCCGAGG CTTTGCGTGG GGAGCTCGCC 
TACCGCGCGC CGCGGCGCCT GCGCGAGACG TACCCGCGCG TCACCGAGAT CTTCGATGCC 
GGCGGTGCGC TGCGCCCGGC GCAGTGGCCG AACCCTGGAC CGAACTCCGG CTGGACGACG 
GTCGCCGCTG CCGAAGCGGG GGGCCTGGCC TTCACCCTCA AGGACGCGTC GGGCCTGCCC 
GATCTGTCCC TGGAGCGCGA CCTGTGGGTG GAGGGCTTCT GGCGCTGGGA CTGGCTGCTG 
GAAACGCTTC ACGTGGCGCA GGTCGATCCG CGCCGCCGGC TCGAACTGGA CCAGCCGCCC 
TACGAGGGCA TCCGCGACGG CGCCCGGATG CGGCTGGTCC ATGCGCTCGG TGCCCTCGAT 
GAACCCGGCG AATGGTGGCG CGACGCCGAG AGCGGCCTGC TGCTGGCCTG GCCGTCTCCC 
GGCGCGGACG ACCTCGAAGT CAGCCTCGCC GAGACGCTGA TCCAGGCCGA TGGCGCGCGG 
CACCTACGCA TCGAGCGGCT TCGGCTGGAG CGCGCGCGCG GCGATCTGAT CGTCGTGCGG 
GGGGGCGAGG ATATCGAGAT CCGCGCGAGC GAACTGGCCT GGGCGGCAGG CCGGGCGGCG 
GTGTTCGAGG GGGTGACCGG GGGCGGCGTC TCCGGCAGCA CGGTCCACGA TATCGGCGCG 
AGCGCGGTCC GCCTCGTCGG CGGCGACCGC GCCACGCTCC GGCGGGGCGG GCTGTTCGTG 
CGCGACACCC GCTTCACCCG CTTCTCGCGG CTGAGCCAGA CCCAGAGTTC CGCGATCGAA 
CTCGACGGCG TCGGCGCGGA GGCGAGCGGA AACCTCATCA CCGACGCGAT CGGCTACGCC 
ATCTACCTGC GCGGCAACGA CCACGTGTTT CGCGGCAACG AGGTCGCCCG CCTGATCCAC 
GGCCTGAGCG ATACCGGCGC CATCTATGCC GGACGCGACT TCACCGCCCG CGGCTCGATC 
ATCGAGGACA ATTACGTCCA CGACATCCGC ACCGTGCCTG GCATGGAGGT GAAGGGCGTC 
TATCTCGACG ACATGGCGAG CGGCTTCACC ATCCGCCGCA ACCTGTTCGT CGATGTGCAG 
CAGCCGGTCT TCATCGGCGG CGGCAACGAC AACACGATCA CCCGCAACGT CTTCGTCGCG 
TCGAGCCCGA TGGTCGCTCT CGATGCGCGG GGTCTGACGT GGATGAAGCC ATCGCTGAAC 
GAGGCGGATT CGGAGTTCCG GGCCGCCTTC GCCGCGATGC CGCTCGACTC CGCGCCTTGG 
CGGATGCGCT ACCCGAAGCT TGCGGAGGCG CTGACCGACG AGCCCGGCGT GGCGCGCAAC 
AACCAGATCG TCGATAACGT GAGCATCGGC AGCGACGACC TCGCGTTCAC CGACAAGGCG 
GAGGTGGGCC GGCAGATCAT TCTGTTCAAC ACCCGCCTCG ACGGCCCGGT CCCGAATCCC 
GGCGACCTCG AGGCGCTGGC CCGCTTCACC GCCGAGCGCG GCATCACGCT TCGCCTCGAC 
CCGTCGAAGA TGCGGCGGGA CGGGTTACCC GTCTCGCCGT TCACGGACGC GCGGCGCTGA

Protein sequence

MSLGPLRSAA AFLAAVLIGS PLFGFTAAVR GGEAKAPLVL RVAPTGDKAP RRDARFADLP 
RALAYVAALR RQGEARAIVV ELEPGTHRIS APVRIGPHHA GTEGAPLILR GADDGSSRLV 
GSVPLTPASL PPRLRARLPA SARGAVRAYQ LPEALRGELA YRAPRRLRET YPRVTEIFDA 
GGALRPAQWP NPGPNSGWTT VAAAEAGGLA FTLKDASGLP DLSLERDLWV EGFWRWDWLL 
ETLHVAQVDP RRRLELDQPP YEGIRDGARM RLVHALGALD EPGEWWRDAE SGLLLAWPSP 
GADDLEVSLA ETLIQADGAR HLRIERLRLE RARGDLIVVR GGEDIEIRAS ELAWAAGRAA 
VFEGVTGGGV SGSTVHDIGA SAVRLVGGDR ATLRRGGLFV RDTRFTRFSR LSQTQSSAIE 
LDGVGAEASG NLITDAIGYA IYLRGNDHVF RGNEVARLIH GLSDTGAIYA GRDFTARGSI 
IEDNYVHDIR TVPGMEVKGV YLDDMASGFT IRRNLFVDVQ QPVFIGGGND NTITRNVFVA 
SSPMVALDAR GLTWMKPSLN EADSEFRAAF AAMPLDSAPW RMRYPKLAEA LTDEPGVARN 
NQIVDNVSIG SDDLAFTDKA EVGRQIILFN TRLDGPVPNP GDLEALARFT AERGITLRLD 
PSKMRRDGLP VSPFTDARR