Gene Msil_2086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2086
Symbol
ID	7091452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	2259447
End bp	2260565
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	63%
IMG OID	643465410
Product	Extracellular ligand-binding receptor
Protein accession	YP_002362387
Protein GI	217978240
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCCA GCTTCGCTCG CCTCAGCCTG ATGACGGCTT TTTTCCTCGC CGCCGTCGCG 
CCCCCCGCGA TCGCTGAAGT GCGCTTTGGC GTCGGCGCGC CGATCACCGG CCCCGACGCG 
TCTTTCGGCG CACAATTGCG CAACGGCGCC GAGCAGGCCG TCGCCGACAT CAATGCGGCC 
GGCGGCATTC TCGGCGAGAA AGTCACGCTG CGCGTCGGCG ACGATGGCGC GGACCCAAAG 
CAGGGCGTCT CCGTCGCCAA TAAATTCGTC GGCGATCAGG TGTCTGTCGT GATCGGCCAT 
TTCAACTCCG GCGTGAGCCT GCCCGCCTCG GACGTCTACG CCGAAGCCAA TATTTTGCAG 
ATCACGCCGG GATCGACCAA TCCCAAAATC ACCGATCGCG GCATCGAGAC GCTTTTTCGC 
ACCTGCGGCC GCGACGACCA GCAGGGGGCG GTCGCCGCCA AATTCCTCGC CGGGCGGGGC 
TTTAAGAAGA TCGCCATCAT CCACGACAAG ACGACCTATG GCAAAGGACT CGCCGACGAG 
ACGCGCAAGA GCCTCGAGGC GCTCGGCGTC AAGGACGTGC TCTATGAGGG GATCAACAAG 
GGCGAGAAGG ATTATTCGGC GATCGTCTCC AAGATCAAGC AATCCGGGGC TGACGTCATC 
TATTGGGGCG GCGTCCACAC CGAGGGCGGC CTGCTGCTGC GCCAGATGCG CGATCAAGGC 
GTCGAAACGC CGATGATGGG CGGCGACGGC ATCGCCTCCG ACGAATTCGC CGCGATCGCC 
GGCCCCGGCG TCGAGGGAAC CTTCATGACC TTCCCGCCCG ACCCGCGCGA GCGGCCGGAA 
GCGGCGAAAG TAGTGGCGGA ATTCAAGGCG AAGAATTTTA ATCCCGAAAC CTACACGCTC 
TATTCCTACG CGGCGGTGGA GGTGGTGAAG CAGGCGGCGG AGGCGGCCAA ATCGCTCGAC 
GCCGCCGAGA TCGCCAAGAC GATCCATTCC GGCATGGTCT TCAATACGGT GATCGGCCCG 
ATCAGCTTCG ACAAGAAAGG CGACGTGACG CGCGCCGATT ATGTCGTCTT CCTCTGGAAA 
AAGGGGCCCG ACGGCAAGAT CAGCTATTAC CAGATGTGA

Protein sequence

MKPSFARLSL MTAFFLAAVA PPAIAEVRFG VGAPITGPDA SFGAQLRNGA EQAVADINAA 
GGILGEKVTL RVGDDGADPK QGVSVANKFV GDQVSVVIGH FNSGVSLPAS DVYAEANILQ 
ITPGSTNPKI TDRGIETLFR TCGRDDQQGA VAAKFLAGRG FKKIAIIHDK TTYGKGLADE 
TRKSLEALGV KDVLYEGINK GEKDYSAIVS KIKQSGADVI YWGGVHTEGG LLLRQMRDQG 
VETPMMGGDG IASDEFAAIA GPGVEGTFMT FPPDPRERPE AAKVVAEFKA KNFNPETYTL 
YSYAAVEVVK QAAEAAKSLD AAEIAKTIHS GMVFNTVIGP ISFDKKGDVT RADYVVFLWK 
KGPDGKISYY QM