Gene Mext_3487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3487
Symbol
ID	5834419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	3865618
End bp	3866844
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	69%
IMG OID	641369286
Product	twin-arginine translocation pathway signal
Protein accession	YP_001640943
Protein GI	163852900
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.847198
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCC CCGACGACCT CTCCGCCCTC TGGACGCACG AATGGGCCCG CGCCGACTGG 
ACGCGGCGCA ACACCCTCGA CGCGCTGGCC CGCGGCGGCC TCGCCGCCCT GCTCGGCGGC 
GGCAGTCTCG CCCTGTCGGG CCGCGCGGTC CATGCCGCCG AGGACGACAC CGTGCGCATC 
GGCTACCTGC CGATCACCGA CGCGACCGCT TTGCTGGTGG CCCATGCCAA GGGCTATTTC 
GAGGAGGCGG GCCTGAAGGT TGCCGAGCCG ATTCCGGTGC GCTCGTGGTC GGCGCTGGTG 
GAGGGGTTCG CCGCGGGCAA GTTCAACCTC GCCCACCTGC TCAAGCCCAT CCCCGTCTGG 
ATGCGCTACA ACAACAAGTT CCCGGTCAAG ATCCTGGCCT GGGCCCACAC CAACGGCTCG 
GGCATCGTCG TCGGGGGAAA AAGCGGGATC GAGGACTTCA AGGGGCTCGC GGGCAAGCGC 
GTCGCGGTGC CGTACTGGTA CTCGATGCAC AACGTCGTGC TGCAATACGC GCTGCGCGAA 
TCCGGCGTCA CGCCGGTGAT CCGAGGGGAT GCCGGGCCGA ACGAGTGCGC GCTTCAGATC 
CTGGCGCCGC CCGAGATGCC GGCAGCGCTC GCGGCGGGCA AGATCGACGG CTACATCGTC 
GCCGAGCCGT TCAATGCGCT CGGCGAGATC AAGGCCGGCG CACGGATGCT GCGCTTCACC 
GGCGACATCT GGAAGAACCA TCCCTGCTGC GTCGTGGTCG CGCATGAGAG CCAGATCGCG 
GCCAAGCCCG AATGGGCCGG TAAGGCGGTC GATGCCATCG TGCGGGCGCA GGCCTATTGC 
GTGAAGAACC GCGAGGAGGT CGCCCGGCTG ATCTCGAAGG AGGGCCGCGG CTACCTGCCG 
ATGCCCGCCG ACGTCGTCAT CAAGGCGACC ACCGATTACG GCCCGGCCTA TGAGGCGAGC 
GGCGCGATCC GCCACCGCGA CTGGGCGGCG CACCGCATCG ACTTCCAGCC CTGGCCCTAC 
CCCTCCGCCA CGAAGCTGAT CGTCGAGGCG ATGGGCAACA CCGTGGTCGA GGGCGATGCC 
GGCTTCCTCA AAGGGCTCGA CCCGGATTTC GTCGCGCGCG ACCTCGTGGA CGATCGCTTC 
GTGCGGGCCT CGCTCAAGCG CTATCCCGAA TGGCCGGGCG CGGCGGATGA CGCCGCGCTC 
ACCCGCCAGG AGACCTTGAG CCTGTGA

Protein sequence

MTAPDDLSAL WTHEWARADW TRRNTLDALA RGGLAALLGG GSLALSGRAV HAAEDDTVRI 
GYLPITDATA LLVAHAKGYF EEAGLKVAEP IPVRSWSALV EGFAAGKFNL AHLLKPIPVW 
MRYNNKFPVK ILAWAHTNGS GIVVGGKSGI EDFKGLAGKR VAVPYWYSMH NVVLQYALRE 
SGVTPVIRGD AGPNECALQI LAPPEMPAAL AAGKIDGYIV AEPFNALGEI KAGARMLRFT 
GDIWKNHPCC VVVAHESQIA AKPEWAGKAV DAIVRAQAYC VKNREEVARL ISKEGRGYLP 
MPADVVIKAT TDYGPAYEAS GAIRHRDWAA HRIDFQPWPY PSATKLIVEA MGNTVVEGDA 
GFLKGLDPDF VARDLVDDRF VRASLKRYPE WPGAADDAAL TRQETLSL