Gene Mchl_3795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_3795
Symbol
ID	7116990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	4007254
End bp	4008480
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	69%
IMG OID	643526531
Product	twin-arginine translocation pathway signal
Protein accession	YP_002422542
Protein GI	218531726
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.296999
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCC CCGACGACCT CTCCGCCCTC TGGACGCACG AATGGGCCCG CGCCGACTGG 
ACGCGCCGCA ACACCCTCGA CGCGCTGGCC CGCGGCGGCC TCGCCGCCCT GCTCGGCGGC 
GGCAGTCTCG CCCTGTCGGG CCGCGCGGTC CATGCCGCCG AGGACGACAC CGTGCGCATC 
GGCTACCTGC CGATCACCGA CGCGACCGCG CTGCTGGTGG CCCATGCCAA GGGCTATTTC 
GAGGAGGCGG GCCTGAAGGT CGCCGAGCCG ACGCCCGTGC GCTCGTGGTC GGCGCTGGTG 
GAGGGGTTCG CCGCGGGCAA GTTCAACCTC GCTCACCTGC TCAAGCCCAT CCCCGTCTGG 
ATGCGCTACA ACAACAAGTT CCCGGTCAAG ATCCTGGCTT GGGCGCACAC CAACGGCTCG 
GGCATCGTCG TCGGCGGCAA AAGCGGGATC GAGGACTTCA AGGGACTGGC GGGCAAGCGC 
GTCGCGGTGC CGTACTGGTA CTCGATGCAC AACGTCGTGC TGCAATACGC GCTGCGCGAA 
TCCGGCGTCA CGCCGGTGAT CCGCGGGGAT GCCGGGCCGA ACGAGTGCGC GCTTCAGATC 
CTGGCGCCGC CCGAGATGCC GGCAGCGCTC GCGGCGGGCA AGATCGACGG CTACATCGTC 
GCCGAGCCGT TCAATGCGCT CGGCGAGATC AAGGCCGGCG CACGGATGCT GCGCTTCACC 
GGCGACATCT GGAAGAACCA TCCCTGCTGC GTCGTGGTCG CGCATGAGAG CCAGATCGCG 
GCCAAGCCCG AATGGGCCGG CAAGGCGGTC GATGCCATCG TGCGGGCCCA GGCCTATTGC 
GTGAAGAACC GCGAGGAGGT CGCCCGGCTG ATCTCGAAGG AAGGCCGCGG CTACCTGCCG 
ATGCCCGCCG ACGTCGTGAT CAAGGCGACC ACTGATTACG GCCCGGCCTA CGAGGCGAGC 
GGCGCGATCC GCCACCGCGA CTGGGCGGCG CAACGCATCG ACTTCCAGCC CTGGCCCTAC 
CCCTCCGCCA CAAAGCTGAT CGTCGAGGCG ATGGGCAACA CCGTCGTCGA GGGCGATGCC 
GGCTTCCTCA AAGGGCTCGA CCCGGATTTC GTCGCGCGCG ACCTCGTCGA CGACCGCTTC 
GTCCGGGCCT CGCTCAAGCG CTATCCCGAA TGGCCGGGCG CGGCGGATGA CGCCGCGCTC 
ACCCGCCAGG AGACCTTGAG CCTGTGA

Protein sequence

MTAPDDLSAL WTHEWARADW TRRNTLDALA RGGLAALLGG GSLALSGRAV HAAEDDTVRI 
GYLPITDATA LLVAHAKGYF EEAGLKVAEP TPVRSWSALV EGFAAGKFNL AHLLKPIPVW 
MRYNNKFPVK ILAWAHTNGS GIVVGGKSGI EDFKGLAGKR VAVPYWYSMH NVVLQYALRE 
SGVTPVIRGD AGPNECALQI LAPPEMPAAL AAGKIDGYIV AEPFNALGEI KAGARMLRFT 
GDIWKNHPCC VVVAHESQIA AKPEWAGKAV DAIVRAQAYC VKNREEVARL ISKEGRGYLP 
MPADVVIKAT TDYGPAYEAS GAIRHRDWAA QRIDFQPWPY PSATKLIVEA MGNTVVEGDA 
GFLKGLDPDF VARDLVDDRF VRASLKRYPE WPGAADDAAL TRQETLSL