Gene M446_3388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3388
Symbol
ID	6135310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	3762110
End bp	3763504
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	78%
IMG OID	641643560
Product	protein TolA
Protein accession	YP_001770212
Protein GI	170741557
COG category	[S] Function unknown
COG ID	[COG2268] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain [TIGR02794] TolA protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.457375
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.323397
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCTGC CCTCCCTCAA GCGGTCCGAG CCCGGAATCT GGATCTCGGG GCTGATTCAC 
GTGGCCCTGC TCGGCGCCGC GCTCTACGCC GCGGCGGCCC ACGAGCTGCC GCGGGCCGAG 
GAGGGCGTGC CCGTCGAGGT CATCACCGAG AACGAGTTCT CGGAACTCAC GCGCGGCCGG 
CCGGAGGGCG ACGCGCCCGC GAAGGCCCCG CGCGCCGACC GCGTCGCCGA CAAGGCGATC 
GAGAAGGATC CCGGCGAGGC CAAGACCGAC GTGCCGACCC CGCCGACCCG CCCGCCCGAG 
ATGAGGGTGG CGAATGCCGA GGAGCCGGTC CTGCCGCCGC TGCGGCCGGC CCTGGAGCCG 
CCCGCGCCCC TGCCGCCGAC GCGCCCCGAC GACAGCGAGG CGCGCGAGCA GGCGCGGGCC 
GAGGCCGCGA AGGCGGAGGC CGCCAGAGCG GAAGCGGCCA AGGCCGAAGC CGCCCGGGCG 
GCCCGCGCCG AGGCCGCCAA GGCCGCCGCC GAGGCCGCGA AAGCCGCCGC CGCGAGGGCC 
GCCGAGAAGG CGCAGGCCGA GGCGAAGGCG AAGGCCGAAG CGGCCCGCCG CGAGGAACTG 
GCGGAGCTGA TCGCCCGCGA GGAGGCCGAG GCGAAGGAGA AGGCCGCGCA GGAGAAGGCC 
CGGGCCGAGA AGGCGCGGGC GGAGAAGGCC CGCGCCGAGG CCAAGGCGCA GGCCGAGGCC 
CGGGCCAAGG CCGAGGCGGA GGCCAAGGCC GAGGCGGAGG CGGAAGCCCG GGCGGAAGCG 
AAGGCGAAGG CCGCCGCGGA GGCCAAGGCG GCGGCTGAGG CCAAGGCGGC CGCGGAGGCC 
AAGGCGGCCG CGGAGGCCAA GGCCAAGGCC GACGCGGCCC GCGCCAAGGC GGTCGCGGAG 
GCGAAAGCCA AGGCGGCGGC CGAGGCGAAG GCGCGCCGGC AGGCCGAACT CGCCAACCAG 
TTCAATGCCG GCTCGATCCG CGACATGCTG GCCACCCGCG CCCCCGCCCA GGCGAGCGGC 
GCCACCGGCC GCGAGGTCCA GCGCACGGCG GCCCTCGGCA CCGCCTCGGG GAGCGCGGCC 
CGGCTCAGCC CGAGCCAGCG CGACGCCCTG GTCGGCCTGC TGCAGCAGCA GATCGAGCGC 
TGCTACTCGG CCCCGCCCGG CGCCGCCCAG GGCGTGGTGC TGCCGCAGCT CGACATCCGG 
CTCAATCCGG ACGGGTCGCT CGGGGCCGAG CCGCGCATCC TGCGGGCCGG GGGCAGCGCG 
GTCGACCGCT CGATCGCTGA GGCGGCCGTG CGCGCGGTGC GCCGCTGCGC CCCCTACCGC 
ATCCCCTCCC AGTTCGCGCC CTTCTACAGT GATTGGCGCG TGATCAACGC GGAGTTCGAG 
CTGCCGCGGG CCTGA

Protein sequence

MGLPSLKRSE PGIWISGLIH VALLGAALYA AAAHELPRAE EGVPVEVITE NEFSELTRGR 
PEGDAPAKAP RADRVADKAI EKDPGEAKTD VPTPPTRPPE MRVANAEEPV LPPLRPALEP 
PAPLPPTRPD DSEAREQARA EAAKAEAARA EAAKAEAARA ARAEAAKAAA EAAKAAAARA 
AEKAQAEAKA KAEAARREEL AELIAREEAE AKEKAAQEKA RAEKARAEKA RAEAKAQAEA 
RAKAEAEAKA EAEAEARAEA KAKAAAEAKA AAEAKAAAEA KAAAEAKAKA DAARAKAVAE 
AKAKAAAEAK ARRQAELANQ FNAGSIRDML ATRAPAQASG ATGREVQRTA ALGTASGSAA 
RLSPSQRDAL VGLLQQQIER CYSAPPGAAQ GVVLPQLDIR LNPDGSLGAE PRILRAGGSA 
VDRSIAEAAV RAVRRCAPYR IPSQFAPFYS DWRVINAEFE LPRA