Gene M446_3179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3179
Symbol
ID	6131560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	3518011
End bp	3519180
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	73%
IMG OID	641643367
Product	CBS domain-containing protein
Protein accession	YP_001770019
Protein GI	170741364
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0353609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0370442
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACG ATCGAAGTCG TGGCGCCGCC GCGACCGCCC AGCCCGCCCC GGACGAGGAC 
AGTCCGGCCC GTGAGCCGTG GTATGACCGT CTCCTCACCA TCTTCCACCT GAAGCCGCGG 
GAGGCTCCGC GCGACGAGAT CACCGACGCG CTGGCGGAGG CGCAGTCGGG CGATCACGCC 
TTCTCGCCCG TCGAGCGGGC GATGCTGAAG AACGTGCTGA GCCTGCACCG GGTGCGGGTC 
GACGACGTGA TGGTGCCGCG GGCCGACATC GTCGCCGTGC CGGCGGAGAT CTCCCTCGGC 
GAACTCCTGA AGGTGTTCCG GACGGCGGGC CATTCGCGCC TGCCGGTCTA CGGCGACACC 
CTGGACGATC CCCGCGGCAT GGTCCACATC CGCGACTTCG TCGACCACCT CGCCACCCGC 
GCCGAGGCCG GCGCGGCCCA CGGCGCCAAA TCCCCGGCCA GATCCCCGGC CAACTCCCCG 
GCCAACTCCC CGGCCAAGCC CGCGGCCGAG CCGCCGCCGG TGATCCAGGG GGACGGGCGG 
GCGCGCCGGC CGCACCTCGC CCGGACGCCC GACCTGTGCG AGGTCGATCT CGACCTCTCC 
CTCGCCGCCA CGCGGATCCT GCGGCCCGTG CTCTACGTGC CGCCCTCGAT GCCGGCGATC 
GACCTCCTGG TGCGGATGCA GGCCAGCCGG ACCCACATGG CCCTCGTCAT CGACGAGTAT 
GGCGGGACCG ACGGGCTGAT CTCGATCGAG GACCTGATCG AGGTCGTGGT CGGCGACATC 
GAGGACGAGC ACGACGTGGC CGAGGGGCAC CGGGTGCTGC GGGTCGACGG CGAGGCCGAG 
ATCTACGTGG CGGATGCGCG CGCGAGCCTC GACGACGTCG CGGAGGCGAC CGGCTTCGAC 
ATCGCCGGGG CGGTGGGCGA ACTCGCCGAG GAGGTCGACA CGATCGGCGG CCTCGTCGTC 
ACCATCACCG GGCGGGTGCC GTCCCGGGGC GAGGTCGTGG CGGTTCCGGG CGACTTCGAG 
GTCGAGGTGC TGGACGCCGA TCCACGCCGC ATCAAGCGGC TTCGCCTCCA CCACGGCCCG 
GCCAAGCTCG CCGCCCCGGA GGAGCCCCTG GCCCTGCCGG CACCCCGCAC GCTCAACGGC 
AGCGGCGCCC CGGTCGACGC CGGGGCGTGA

Protein sequence

MSNDRSRGAA ATAQPAPDED SPAREPWYDR LLTIFHLKPR EAPRDEITDA LAEAQSGDHA 
FSPVERAMLK NVLSLHRVRV DDVMVPRADI VAVPAEISLG ELLKVFRTAG HSRLPVYGDT 
LDDPRGMVHI RDFVDHLATR AEAGAAHGAK SPARSPANSP ANSPAKPAAE PPPVIQGDGR 
ARRPHLARTP DLCEVDLDLS LAATRILRPV LYVPPSMPAI DLLVRMQASR THMALVIDEY 
GGTDGLISIE DLIEVVVGDI EDEHDVAEGH RVLRVDGEAE IYVADARASL DDVAEATGFD 
IAGAVGELAE EVDTIGGLVV TITGRVPSRG EVVAVPGDFE VEVLDADPRR IKRLRLHHGP 
AKLAAPEEPL ALPAPRTLNG SGAPVDAGA