Gene Msil_3716 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3716
Symbol
ID	7093070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	4076159
End bp	4077190
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	65%
IMG OID	643467002
Product	Bile acid:sodium symporter
Protein accession	YP_002363961
Protein GI	217979814
COG category	[R] General function prediction only
COG ID	[COG0385] Predicted Na+-dependent transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.0440669
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGACC GGCAGCTCTT GTCCCGCTTG GGGATCGATC CCTATCTTTT CGCGCTCATC 
GCCACGGTGA CGCTCGCGCT GATTTTTCCC GCGCGCGGCG CCGCGGCGGA AGTGGCGGGC 
TACGCGGCCT ATGGCGCGGT CTCGCTCTTG TTCTTCCTTT ATGGCGCGCG CCTCGCGCCG 
CGTGCCGTCA TCGAGGGATT TTCCCATTGG CGGCTGCAAT CGACAGTGCT GTTCCTGACA 
TTTGTTCTGT TTCCGGCGAT CGGTATCGCC CTCACGGCGG CTCTGCGCCC CTTCCTGTCG 
CCGCCGCTTG CGGTCGGCCT GCTTTACCTT TGCCTGATGC CCTCGACGAT CCAGTCCTCG 
ATCGCCTTCA CCTCAATTGC CCGCGGCAAT GTCGCGGCGG CGCTTTGCAG CGCTTCGGCC 
TCCAACGTGC TCGGCGTTTT CATCAGCCCG ATGCTTGTCG CTTTGCTTTT GTCGACGCAG 
AGCCACGGCT TCAACGTCGC GGCCGTGGAG GATGTGGCCT TGCAGCTTCT TCTGCCTTTC 
GCCCTCGGGC AGCTCGCCCG GCCGCTGATC GGCCGCTGGC TCCTGGCGCA TAAGGTGATG 
ACGTCGATCG TCGATCGCGG CTCGATCCTG CTGATCGTCT ATGTCGCCTT CGCCGAGGGG 
ACCGCCGCCG GCGTCTGGGC GCAGCTCAGC TGGCAGGGAC TGGCGCTGAT TCTTGCGCTC 
GACTGCCTCA TTCTGGCGCT TGTCCTCGTC GCGTCGACGC TCCTCAGCCG CCGGCTTGGT 
TTTTCGAAAG AGGATGAGAT CGCCATCGTC TTCTGCGGCT CGAAAAAAAG CATGGCGGGC 
GGCGTGCCGA TGGCGAGCAT CCTGTTTCCG GGGCAGCCGC TCGGCCTCAT CGTGCTGCCG 
CTGATGCTAT TTCATCAGGT GCAGCTGTTC GCCTGCGCCA TTCTGGCCCA GCGCTATGCC 
CGCCGTCCCG CGGCGCCCGT GCGCGCCGAC GCGCAGATTA CGCCGCCAGA GCAGCGTCTG 
GCCGCCGAAT AG

Protein sequence

MFDRQLLSRL GIDPYLFALI ATVTLALIFP ARGAAAEVAG YAAYGAVSLL FFLYGARLAP 
RAVIEGFSHW RLQSTVLFLT FVLFPAIGIA LTAALRPFLS PPLAVGLLYL CLMPSTIQSS 
IAFTSIARGN VAAALCSASA SNVLGVFISP MLVALLLSTQ SHGFNVAAVE DVALQLLLPF 
ALGQLARPLI GRWLLAHKVM TSIVDRGSIL LIVYVAFAEG TAAGVWAQLS WQGLALILAL 
DCLILALVLV ASTLLSRRLG FSKEDEIAIV FCGSKKSMAG GVPMASILFP GQPLGLIVLP 
LMLFHQVQLF ACAILAQRYA RRPAAPVRAD AQITPPEQRL AAE