Gene M446_1048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1048
Symbol
ID	6131781
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	1163520
End bp	1164554
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	75%
IMG OID	641641341
Product	hypothetical protein
Protein accession	YP_001768013
Protein GI	170739358
COG category	[R] General function prediction only
COG ID	[COG2984] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGGGC CGTTCGCGCC GGCGATCCCG GCCGCGGCGC GCGCGCCCGT GAGGCGGGCG 
ATCCGGCGGC GCGACCTGAT CCCGCTCTGC GCCGCGGCGG CGGCGTGGCC CCTCGGCGCG 
CGCGCGGAGC GCGGTCCGCG CCGGATCGGA ATCCTCGTCA CGGGGTCGCC GGACTCGCAC 
GGCGCCTTCG TGGCGGCGTT CCGGCGGCGG CTAGCGGAAC TCGGCCACGC CGAGGGACGG 
GACGTCGCCT TCGACCTGCG CTGGAGCGAA GGCCGGATCG AGCGCCTGGG GCCCCTCGCG 
GAGGATCTCG CGCAGCTCGC CCCGGACCTC GTGGTGACCT CGACGACCGC CGCGGCCCTG 
GCCGCCAAGC GCGTCATGCC GGAGCGCCCG ATCGTGTCCG CGACCCTGAT CGACCCGATC 
GGCGCCGGGC TGGTGACCAG CCTCGCCCGC CCGGGCGGCA CCGTCACGGG CATGCTGATC 
AGCTTCGAGA CCCTCCTCGG CAAGCAGCTC GAAGTGGCCC GCGAGATGCT GCCGGGCGTC 
ACGCGGATCG GGATGCTGGT CAACCCGGCC AATCCGGTGA TCCCGTTCCA GCGCGAGAAC 
ACGCAGGCCT ATGCGGACCG GCTGCGGGCG CGGCTGATCC CGGTCGAGGC CCGCTCCCCG 
GCGGACCTCG ATGCCGCCTT CGCGACCTTC GCGCGGGACT CCGCCGGCTT CGTGATCGTG 
CTGCTGGACG CGCTGTTCAT CACCCACCGC GCGCGGATCG CCGAACTCGC CCTCGCGTCG 
CGCGTCCCGA CCGTCGCGGG CGCGCGCGAG TTGGCGGAGG CGGGCGGCCT CGTGAGCTAC 
GGGATCGACC TGAGCGCGAC CTGGCGCCAG GCGGCCGCCT TCGCGGACCG CGTCCTGCGC 
GGCGCCAGGC CGGCGGACCT GCCTGTCGAG CTTCCGACCA AGTACGAACT CGTGCTCAAT 
CTCGGGGCCG CTTCGCGCTT CGGGATCACG GTCTCGACCA TGCTGCTCGC CCGCGCCGAC 
ACGGTCATCG AGTGA

Protein sequence

MPGPFAPAIP AAARAPVRRA IRRRDLIPLC AAAAAWPLGA RAERGPRRIG ILVTGSPDSH 
GAFVAAFRRR LAELGHAEGR DVAFDLRWSE GRIERLGPLA EDLAQLAPDL VVTSTTAAAL 
AAKRVMPERP IVSATLIDPI GAGLVTSLAR PGGTVTGMLI SFETLLGKQL EVAREMLPGV 
TRIGMLVNPA NPVIPFQREN TQAYADRLRA RLIPVEARSP ADLDAAFATF ARDSAGFVIV 
LLDALFITHR ARIAELALAS RVPTVAGARE LAEAGGLVSY GIDLSATWRQ AAAFADRVLR 
GARPADLPVE LPTKYELVLN LGAASRFGIT VSTMLLARAD TVIE