Gene Msil_2234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2234
Symbol
ID	7091356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2418723
End bp	2420051
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	62%
IMG OID	643465555
Product	sodium:dicarboxylate symporter
Protein accession	YP_002362530
Protein GI	217978383
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.709095
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGCGG TATCGGCAGG CGCGGAGCCG AGCGCTCCGG CGAAACCGTT CTACAAGGTC 
CTCTATGTGC AGGTCCTGTT CGGCATCCTG GTCGGCGCCC TGTTTGGTTG GCTTTGGCCG 
GAATATGCGA CCGCGCCCTG GGTGAAGGCG CTCGGCGACG GCTTCATCAA GCTGATCAAG 
ATGCTGATCG CGCCGATCAT TTTCTGCACC GTCGTCGCCG GCATCGCCCA TGTCTCGGAC 
GCCAAGAAGG TGGGCCGCGT CGCCGTCAAG GCGTTGATCT ATTTCGAGAT CGTCTCGACC 
TTCGCGCTCG GCTTCGGACT GCTCATGGGC AATGTCGTGC GGCCCGGGGC GGGATTTTCG 
GGCAGCCATG GCGACGCGGC CGCGGCGATC GCCTTCGAGA AGCAGGGGGA GGGACATTCG 
ACGGTCGACT TCCTGCTCGG GATCATTCCC GACAGCGTCG TCGGCGCCTT CGCCAAGGGC 
GACGTGCTGC AGGTGCTGCT GTTCGCCATT CTGTTCGGCT TCGCGCTGAT GGCCCTCGGC 
GACCGCGGCA AGGTCGTGCT GCATGTGATT GACGAGGCGG GGCACGCCAT CTTCGGCGTC 
ATCAATATTG TGATGAAGCT CGCGCCGCTC GGCGCCTTTG GCGCGATGGC CTTTACCGTC 
GGCAAATATG GGCCGCAATC GCTTGGAAAC CTCGCCGGCC TGATCGCCAC CTTCTACGCG 
ACGTCAGCGC TGTTCATTTT CCTCATTCTT GGGACAATCG CCCGCATCGC CGGCTTCAAC 
ATCTTCAAAT TCCTCAATTA CATCAAATCC GAACTCCTCA TCGTGCTCGG CACCAGCTCC 
TCGGAGAGCG CCTTGCCGGC CCTGATGGAA AAGCTCGAAC GGCTCGGCTG CTCGCGGCCG 
GTCGTCGGCC TCGTCGTGCC GACCGGCTAC TCCTTCAATC TCGACGGCAC CAATATTTAC 
ATGACGCTGG CGACGCTGTT CATCGCCCAG GCGCTCAACG TCGATCTGAC CTTCGGGCAG 
CAGATGACCA TTCTCATCGT CGCCATGCTG ACCTCGAAAG GGGCGAGCGG CGTCACCGGC 
GCGGGCTTCG TCACGCTGGC GGCGACCCTC GCCGTGGTCA ATCCGGCGCT CGTGCCGGGC 
ATGGCGATCG TGCTTGGAAT CGACAAATTC ATGAGCGAAT GCCGCGCGCT GACCAATATC 
ATCGGCAATG GCGTCGCGAC CGTTGTGATC TCCTGGTCGG AAGGCGAGCT CGATCGCGAA 
AAACTCAACT TGGCGCTCGG CAAGAATATC GATGTGAGCG ACATCAAGAC AGGCGTCGCC 
ACCCCTTGA

Protein sequence

MVAVSAGAEP SAPAKPFYKV LYVQVLFGIL VGALFGWLWP EYATAPWVKA LGDGFIKLIK 
MLIAPIIFCT VVAGIAHVSD AKKVGRVAVK ALIYFEIVST FALGFGLLMG NVVRPGAGFS 
GSHGDAAAAI AFEKQGEGHS TVDFLLGIIP DSVVGAFAKG DVLQVLLFAI LFGFALMALG 
DRGKVVLHVI DEAGHAIFGV INIVMKLAPL GAFGAMAFTV GKYGPQSLGN LAGLIATFYA 
TSALFIFLIL GTIARIAGFN IFKFLNYIKS ELLIVLGTSS SESALPALME KLERLGCSRP 
VVGLVVPTGY SFNLDGTNIY MTLATLFIAQ ALNVDLTFGQ QMTILIVAML TSKGASGVTG 
AGFVTLAATL AVVNPALVPG MAIVLGIDKF MSECRALTNI IGNGVATVVI SWSEGELDRE 
KLNLALGKNI DVSDIKTGVA TP