Gene M446_3743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3743
Symbol
ID	6133584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	4176865
End bp	4178160
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	69%
IMG OID	641643913
Product	twin-arginine translocation pathway signal
Protein accession	YP_001770557
Protein GI	170741902
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.869277
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0637205
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGATCG GCAGGGGTGA CCACACGACG CGTCGCGGCC TTCTGAAGGG GGCGGCCGCC 
GCCCTCTCGC TCACCGCCGC CGCCAGGGCC GCGCTGCCGG GCGGGGCCTT CGCGCAGGGG 
ACGGGGCCCG AGGTGAAGGG CGCCAAGCTC GGCTTCATCG CGCTGACCGA CGCGGGCCCG 
CTCTTCGTCG CCAAGGAGAA GGGCTTCTTC GCCAAGCACG GCATGCCCGA GGTGGAGGTG 
CTCAAGCAGG CCTCCTGGGG CACCACCCGC GACAACCTCG TCCTCGGCTC CGAGGGCAAC 
GGCATCGACG GCGCCCACAT CCTGACGCCG ATGCCCTACC TGATCAGCGC CGGCCGGGTG 
ACCCAGAACA ACGTCCCGGT GCCGATGCAC ATCCTCGCCC GGCTCAACCT CAACGGGCAG 
TGCATCTCGG TGGCCAAGGA GTACCTCGAC GCCAAGGTGG CGCTCGATTC CAAGGTCTTC 
CGGGTCGCGA CCGACAAGAA GAAGGCCGCC GGCAAGTCCG TGAAGGCCGC CATGACCTTC 
CCGGGCGGCA CCCACGACCT CTGGATCCGC TACTGGCTGG CGGCCGGCGG GATCGATCCG 
GACCGCGACA TCGAGACCAT CGTGGTGCCG CCGCCCCAGA TGGTGGCGAA CATGAAGGTC 
GGCACGATGG ATTGCTTCTG CGTCGGCGAG CCGTGGAACG CCCAGCTCGT CCAGCAGGGG 
CTCGGCTACA CGGCGCTCAC CACCGGCGAG CTCTGGAAGG ACCATCCCGA GAAGGCCTTC 
GCCATGCGGG CGGACTGGGT CCAGAAATAC CCGAACGCCA CCCGCGCCCT GCTGATGGCG 
GTGATCGAGG CGCAGCAATG GTGCGACCGG CCCGAGAACC GGGACGAGTT CGCCGCCATC 
GTGGCCAAGC GCCAGTGGAT CAACATCCCG GTCGGCGACG TCGCCGGGCG CATGAAGGGC 
ACCATCGATT ACGGCGACGG CCGGGTCGTG AAGGACAGCC CCTTCGTGAT GAAGTTCTTC 
CGCGACCACG CCTCCTATCC GTTCCAGTCC CACGACCTCT GGTTCCTCAC CGAGGACATC 
CGCTGGGGCA AGTTCGAGCC CCAGACCGAC ACCAGGGCCC TGATCGCCAA GGTCAACCGC 
GAGGACCTGT GGCGCGAGGC GGCCAAGGCG CTCGGCGTGA GCGCGATCCC GGCCTCGACC 
TCGCGGGGCA GGGAGACCTT CTTCGACGGC AAGGTCTTCG ATCCGGCCGA TCCGGCCGCC 
TACCTGTCCA GCCTCAGCAT CAAGAAGGTG GCGTGA

Protein sequence

MSIGRGDHTT RRGLLKGAAA ALSLTAAARA ALPGGAFAQG TGPEVKGAKL GFIALTDAGP 
LFVAKEKGFF AKHGMPEVEV LKQASWGTTR DNLVLGSEGN GIDGAHILTP MPYLISAGRV 
TQNNVPVPMH ILARLNLNGQ CISVAKEYLD AKVALDSKVF RVATDKKKAA GKSVKAAMTF 
PGGTHDLWIR YWLAAGGIDP DRDIETIVVP PPQMVANMKV GTMDCFCVGE PWNAQLVQQG 
LGYTALTTGE LWKDHPEKAF AMRADWVQKY PNATRALLMA VIEAQQWCDR PENRDEFAAI 
VAKRQWINIP VGDVAGRMKG TIDYGDGRVV KDSPFVMKFF RDHASYPFQS HDLWFLTEDI 
RWGKFEPQTD TRALIAKVNR EDLWREAAKA LGVSAIPAST SRGRETFFDG KVFDPADPAA 
YLSSLSIKKV A