Gene M446_2649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_2649
Symbol
ID	6135343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	2940751
End bp	2941758
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	74%
IMG OID	641642863
Product	bile acid:sodium symporter
Protein accession	YP_001769522
Protein GI	170740867
COG category	[R] General function prediction only
COG ID	[COG0385] Predicted Na+-dependent transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.19525
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCGC GCTTCCGCCC CGATCCCTTC ATGCTGATGC TCCTCGCCTG CCTGCTCCTC 
GGCGCGTTCC TGCCGGTGAG CGGCGGGCTC GCGGAGGGGC TCGGCAGCGT GGCGACCGGC 
GCGATCGCGC TCCTGTTCTT CCTGCACGGC GCCCGCATCG ACCGGCGCAC GGCCCTGGCC 
GGGCTCGTCC ATTGGCGGCT CCACCTCGTG GTGCTGGCGA CGACGTTCGG GCTCTTCCCG 
CTCCTCGGCC TCGCGGCGGG CCTGCTCGCG CCGAGCCTGC TGACGCCGGC CCTCGCGGCG 
GGCGTGCTGT TCCTGTGCGT CCTGCCCTCG ACCGTGCAAT CGTCGATCGC CTTCACCTCG 
GTGGCGGGCG GCAACGTGCC GGCGGCGGTC TGCGCCGCCT CGGCCTCGAA CATCCTCGGC 
ATGGTCCTGA CGCCGCTCCT GGCCTCCCTG CTGTTCCGGG CCCAGGGCGC CTTCGACTGG 
TCCGGGGCGG GCAAGGTCCT CCTGCAGCTG CTCGCGCCCT TCCTGCTCGG GCAGCTGCTG 
CGGCCGCGGC TCGCGCCGCT CCTGGCCTCC CGCAAGGGGG TGACCGCCCT CGTCGACCGC 
GGCTCGATCC TGCTCGTCGT CTACCTCGCC TTCAGCCACG CCAGCGCGAG CGGGCTGTGG 
TCGCGCACGC CGCTGCCGGC GCTCGCCACC ATGCTGCTCG TCGACGGGAT CCTGCTCGCG 
AGCGTGCTTG CCCTGACCGC GGCCGCGAGC CGGCTGCTCG GCTTCTCGCG GGCGGACGAG 
ATCACCATCG TGTTCTGCGG CTCGAAGAAG AGCCTCGTGG CCGGCGTGCC GATGGCGAAC 
GTCCTCTTCG CCGGGCAGGA TGTCGGGGGT CTGCTCCTCC CGGTGATGCT GTTCCACCAG 
ATCCAGATCG CGGCCTGCGC CGCCCTGGCC CGGCGCTACG CCGCCCGCGG CGGGAGCTAT 
CGAACGGCCC CGGCGGCGCT TTCCGCGCTT CCGCTGGCGT CCCGTTGA

Protein sequence

MRARFRPDPF MLMLLACLLL GAFLPVSGGL AEGLGSVATG AIALLFFLHG ARIDRRTALA 
GLVHWRLHLV VLATTFGLFP LLGLAAGLLA PSLLTPALAA GVLFLCVLPS TVQSSIAFTS 
VAGGNVPAAV CAASASNILG MVLTPLLASL LFRAQGAFDW SGAGKVLLQL LAPFLLGQLL 
RPRLAPLLAS RKGVTALVDR GSILLVVYLA FSHASASGLW SRTPLPALAT MLLVDGILLA 
SVLALTAAAS RLLGFSRADE ITIVFCGSKK SLVAGVPMAN VLFAGQDVGG LLLPVMLFHQ 
IQIAACAALA RRYAARGGSY RTAPAALSAL PLASR