Gene Msil_2671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2671
Symbol
ID	7091140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	2921140
End bp	2922243
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	66%
IMG OID	643465985
Product	NMT1/THI5 like domain protein
Protein accession	YP_002362955
Protein GI	217978808
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACC GTCAAGACAG CGACAAACCG GCGGGCGTCG CATCGTCCCG CCGCATTTTT 
ATCGCCGGGG CCGCCGCGGC GGCCGTCGGA GCGCCCGCAG CCCTCGCGGC CGGCCGCGTC 
TTCGCCTTTC CGCGCGCGGC GATCGACGCG CAGGGGCTGC CGATCTGCAG CGTCGCGGCC 
GACGGTCCGG CGCCCGCGGC CGGGCCGCTG AAGAAAATCA CCTTCGCCTG GAACGCCGGC 
GCGCCCTGCC TCGTCGCCGT CACTGTCGCC AAGGATAAAG GCTTCTTCGC AAGACATGGG 
CTCGACGTCG ACCTCATCAA CTACTCCGGC TCGACCGACC AACTGCTCGA GACGCTCGCG 
ACCGGCAAAG CCGACGCCGC AATCGGCATG GCCCTGCGCT GGCTGAAGCC GCTGGAGCAG 
GGCTTTGACG TCAAGATCAT CGCCAGCACT CATGGCGGCT GCCTGCGCCT TCTCGTTCCG 
GCGGACTCCG GGCTCGGCGA TCTCAAGGAC CTCAAGGGAA AAACGATCGC CGTCAGCGAC 
ATGAATGCGC CGGGAAAAAA CTTCTTCGCG ATCGCTCTGA AAAGGGCGGG GCTCGATCCC 
GTCGCGGACG TCGATTTCAA GCCGTTTCCG GGACCGCTTC TGCGCGCCGC CGTGGAGAAA 
GGCGAGGCGC ACGCCATCGC CGATACGGAT CCCAACACCT TCCTCTGGCT GAAGGACGGC 
AAGTTCAAGG AGATCTCGTC GAATCTTTCG GGGGACTATG CGCAGCGAGC CTGTTGCATC 
GTCGGCGTGC GCGGCGGGCT GGTCCGCGAC GATCGGCCGA CCGCCGCGGC CATCGCCCGG 
GCGCTGCTCG AGGCGGCGGA CTTCGCCCAT GCTCATCCCA GTGAGGCCGC CGCCACCTAT 
CTGCCTTTCG CGCCCGGCAG CGTCTCCCTC GACGATCTGA CGACGCTCGC GAAATATCAT 
ACACATCAGC ACCATCCCGT CGGTCAGGCG CTGAAGGATC AGCTCGCAAG CTATGCGGAA 
GAGTTGAAGC TCGTCTCCGT CTTCAAGCCG ACGACGGATA CGGCGAAATA CGCCGCGCGC 
ATCTATGCCG ATGTCCTCAG CTGA

Protein sequence

MTNRQDSDKP AGVASSRRIF IAGAAAAAVG APAALAAGRV FAFPRAAIDA QGLPICSVAA 
DGPAPAAGPL KKITFAWNAG APCLVAVTVA KDKGFFARHG LDVDLINYSG STDQLLETLA 
TGKADAAIGM ALRWLKPLEQ GFDVKIIAST HGGCLRLLVP ADSGLGDLKD LKGKTIAVSD 
MNAPGKNFFA IALKRAGLDP VADVDFKPFP GPLLRAAVEK GEAHAIADTD PNTFLWLKDG 
KFKEISSNLS GDYAQRACCI VGVRGGLVRD DRPTAAAIAR ALLEAADFAH AHPSEAAATY 
LPFAPGSVSL DDLTTLAKYH THQHHPVGQA LKDQLASYAE ELKLVSVFKP TTDTAKYAAR 
IYADVLS