Gene M446_1987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1987
Symbol
ID	6132928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	2218445
End bp	2219962
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	78%
IMG OID	641642218
Product	Sel1 domain-containing protein
Protein accession	YP_001768886
Protein GI	170740231
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.461505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGGCT CGTCCCTCGC CCTCAAGCAC GCGCTCCTGT GGAGCGGCGA TCCCTGGTAC 
CGCGGGGCCT GGATCATCTG GCCGCAGGCC GCGGCCCTGC TCGCCGCCGG CTGGCTCGTC 
CTCGGCGGCG CGCTCCCCGT CCCCGAGCCG GCCGCCCCCT GGGCGCGCCC GAAGGCGCCG 
CTCACCGGCC CGGAGAGCAC GGCCCTGCGC GACCGCGCCC TCGGCGACCC GGCCGCGCTC 
GCGCAGCTGC GGGCGGCGGC GGCGGAGGGC GGCGCGGAGG CGCAGTTCAG CCTCGGCACC 
CTGTTCGATC CGACCCTCTC GCTGCGGCGC GCCACCACGG CGCCGGACAT GCGCCAAGCG 
CTGGCGCATT ACCGGGCCGC GGCCGAGCAG GGCCACGCGG CGGCGCAGTT CAACCTCGGC 
AACGCGCTCT ACTGGGGTAT CGGCGGCGTG CCGGCCGACC CGGCCGCCTC CCTGCCCTGG 
ATCGAGAAGG CGGCGCAGCA GGGCGTCGTG CCGGCCCAGC GCCTCGCCGG CCTCGCGGCG 
CAGCGCGGCG TCGGCATGGC GGCCGATCCG GCCCGCGCCG CGTCGTGGTT CCGCCGGGCC 
GCGGAGGCGG GGGACGCCTT CGCGCAGGCC GAGCTCGGCT GGGCCTACGA GCGGGGGCTC 
GGCGGGCTCC CCGCCGATCA GGCCGCGGCG GTGGGCTGGT ACCAGAAGGC CGCCGCGCAG 
GGGAATGCCG GGGCCGAGCG GCTGCTCGGG GTGCACCTGC TGGAGGGGCG CGGCATCGCC 
GCCAACAAGG CCCAGGCGAT GGAGCACCTC GCCCGGGCGG CGGGACGGGG CGACGCGGAG 
GCCCAGGCCC GGCTCGGCTA CGCCTTCCTC ACCGGCGACG GCAAGCCGAT GGACCCGAAG 
GAGGCGGTGT CCTGGTTCCA GAAGGCGGCG GACCAGGGCA ACACCTTCGC GCAGCGGCGC 
ATGGGCCTCG CCTACCGCGA CGGGTCCGGC GTGCCGGCCG ACCGCGGCCT GTCCCTGCAA 
TGGTTCCGCC GCGCCGCCGA GGCGGGCGAC GGGTTCGCGG AGGCCGAACT CGGCGCGGCC 
TACGAGACCG GCACCGGCCT GCCCCGCGAC CCGGGCCAGG CCCTCGCCCT CTATCGCCGC 
GCCGCGGAGC ACGGCGACCC GCTGGGGCAG GCCAGGACCG GCGAGGCGCT GCTCCTGGGC 
ACGGGCGGGC CCCGCGATCC GGCCGCGGCC CTGCCCCTGC TCCAGCGCGC CGCGCAGCAG 
AACCAGCCGC TCGCGCAGTA CTATCTCGGC ACGATGTACG ACCAGGGCAA CGGCGTGGCG 
GCCAACCCGG CCGAGGCGGT CTCCTGGTAC CAGCGCGCGG CGCGCAACGG CAACGCCGCC 
GCCCAGAACG CCCTCGGCGT GGCCTACGCG CGCGGCGCGG GCGTGCCGAG GGACCTCGCC 
CAGGCGCGGG CCTGGTTCAG CCAAGCCAAG GCCAACGGCA ACCTCGCGGC CGCCAAGAAC 
CTGGAGCAGC TGCGATAG

Protein sequence

MAGSSLALKH ALLWSGDPWY RGAWIIWPQA AALLAAGWLV LGGALPVPEP AAPWARPKAP 
LTGPESTALR DRALGDPAAL AQLRAAAAEG GAEAQFSLGT LFDPTLSLRR ATTAPDMRQA 
LAHYRAAAEQ GHAAAQFNLG NALYWGIGGV PADPAASLPW IEKAAQQGVV PAQRLAGLAA 
QRGVGMAADP ARAASWFRRA AEAGDAFAQA ELGWAYERGL GGLPADQAAA VGWYQKAAAQ 
GNAGAERLLG VHLLEGRGIA ANKAQAMEHL ARAAGRGDAE AQARLGYAFL TGDGKPMDPK 
EAVSWFQKAA DQGNTFAQRR MGLAYRDGSG VPADRGLSLQ WFRRAAEAGD GFAEAELGAA 
YETGTGLPRD PGQALALYRR AAEHGDPLGQ ARTGEALLLG TGGPRDPAAA LPLLQRAAQQ 
NQPLAQYYLG TMYDQGNGVA ANPAEAVSWY QRAARNGNAA AQNALGVAYA RGAGVPRDLA 
QARAWFSQAK ANGNLAAAKN LEQLR