Gene M446_2138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_2138
Symbol
ID	6130857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	2386532
End bp	2387692
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	76%
IMG OID	641642366
Product	putative PAS/PAC sensor protein
Protein accession	YP_001769034
Protein GI	170740379
COG category
COG ID
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0223192
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.334318
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAGG ATGCGATAGG ATCCGACGCC ATCCGGGCCG CGCTCGCCCT CCTGCTGCAG 
CAGCCTCAGC TGCGCAAGTC GCCCCAGCTC TCGACCTTCC TGTCCTACGT GGTGGGCGAG 
AGCCTCGCGG GACGCGGCAG CCTGCTGAAA TCCTACACCA TCGCCACGGA CGCCCTCGGC 
CGGCCGGCCA ATTTCGATCC GGCGACCGAC GCCATCGTGC GGGTGGAGGC GCGGCGGCTG 
CGCCAGGTGC TGCAGCAGAT CTACGAGGAT CCCGCCTGCC CCCTCAGCGT GCGGATCGAG 
CTGCCGCTCG GGCGCTACGA GCCGACCTTC ACGCGGATCA CGCCGGCGAC CTCCCGCAAT 
CCCGTCCCCG ACCCCGAGGC GAGCCTGCGC GAGAGCGAGC AGCGCTACCG CGCCCTCGTG 
GAGGCGAGCG CCGCCATCGA GTGGCGGGCG AGCCCCGACG GACGCTTCAT CCGCAGCTTC 
GGCTGGACCG CGCGGACCGG CGAGCCCGAG GACCGGCTGC GCGACGAGGG CTGGCTCGAC 
GCGCTCCACC CCGAAGACCG GGGCCGGGCC ACCGAGGCCT GGGCGCAGGC CCGGCGCACC 
GGCGAGCCCC TCGAGATCGC CTACCGGGTC CGGCACCGGG GCGGGCATTA CCGCTGGATG 
CTGGCGCGCG GCATCCCGAT CGAGAATCTC GACGGCAGCA TCCGCGAATG GGTGGGCACG 
CTGTCGGACA TCCACGAGCA GGAGACGGCC GAGGAGGCGC AGCGCGCCCG CAGCGAGGGC 
CTGCGGCTCG CCCTCACGGC CGCCGGCCTC GCCGCCTGGG AGCTCGACCC CGAGACCCGG 
TCGGTGTGCT GGTCGCAGCC GCCGCCGGAC CGGATCGAAC CGCCCGGCGA GGCCGCGCCC 
CGGGGCGGGC CGGCCGAGGA GGAGCCGCTC GACGCGTGGG TGGCGCGGCT CGACCCCGCG 
GACGGGCCGC GCCTGGTCGC GGCCCTGGAA CGCGCCCTGC GGGGCGGGGG CGACGTCGAT 
CTCGTCTACC GCAGCCGCGC GCCGGCCGAG CGGCCCCGCC GCCTCGCCTG CCGCGGCGGC 
CTCGTGCGCA ACGCCCGCGG CGAGGCGCGC CTCGCCGGCG TCGTGGCGGA TGTCACCGGG 
CGCGCGTCGC CGCTGCCTTG A

Protein sequence

MDQDAIGSDA IRAALALLLQ QPQLRKSPQL STFLSYVVGE SLAGRGSLLK SYTIATDALG 
RPANFDPATD AIVRVEARRL RQVLQQIYED PACPLSVRIE LPLGRYEPTF TRITPATSRN 
PVPDPEASLR ESEQRYRALV EASAAIEWRA SPDGRFIRSF GWTARTGEPE DRLRDEGWLD 
ALHPEDRGRA TEAWAQARRT GEPLEIAYRV RHRGGHYRWM LARGIPIENL DGSIREWVGT 
LSDIHEQETA EEAQRARSEG LRLALTAAGL AAWELDPETR SVCWSQPPPD RIEPPGEAAP 
RGGPAEEEPL DAWVARLDPA DGPRLVAALE RALRGGGDVD LVYRSRAPAE RPRRLACRGG 
LVRNARGEAR LAGVVADVTG RASPLP