Gene Msil_3843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3843
Symbol
ID	7092539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	4207266
End bp	4208459
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	67%
IMG OID	643467128
Product	major facilitator superfamily MFS_1
Protein accession	YP_002364087
Protein GI	217979940
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2807] Cyanate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.0201188
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAATC AGCCGCGCCG GTCTTCCAGC GGGCGCGCCG GCGGCCCCTT CGCCGCCATC 
GCCTGCGCGG TCGCGACAGT AGCCATCGTC GGCGTCGGTC TGTCGCTGAC CATGACCCTG 
ATCGCCGTCA GGCTCGGCGA ACAGGGTTTT AGCGCGCGCG CAATCGGCAT CAACACCGCG 
GCGGCCGGCT TTGCGACGCT CGCAAGCGCC AGTTTCATCC CGGATCTTGC GCGCCGCTTC 
GGGGTCGGGC GGCTTTTGTT TGCCGCGCTG ATCTTATGCG TGCTCTGCCT TGCCGCCATG 
GCGATCCGCG ACGACTACTG GCTCTGGCTC GGCCTTCGCG CTTTGTTCGG CGTCGGCCTC 
ACAGTGCTGT TCGTCCTCAG CGAATATTGG ATCAACGCCG TCGCTCCGCC CGAGCGACGC 
GGCGCGATCC TCGGCTTCTA CGCCGCCAGC GTCGCGCTTG GCTTCGCCGC CGGCCCGCTG 
ATTCTCGCCT GCGTCGGCAC GGTCGGCTCC GCGCCCTTCC TGATCGCCAT GGCGCTGTTC 
GCCGCGGCGG CCTTGCCGAT CGTTATCGGC AGCAAATCGG CGCCGGCGAT CGAAACGCAT 
TCCGCGACGC CAGTGCTTGC CTTTCTTCTC GTCGCCCCCG TCGCTACGCT GGCCGGCCTG 
CTGCATGGCG CAATCGAGAC GGCAAGCATG GGATTGTTGC CCGTCTTCGC GCTCCGCTCC 
GGCCTTGGCG CGGAAACCGG CGCATGGTTC GTCACGCTGT TCGCCCTTGG CAATGTCGCG 
TTTCAGTTTC CCGTCGGATT TCTCGCCGAT ATGATCGAGC GTCGCCGCCT GCTCATGATG 
ATCGCTCTCG TCAGCCTGAT CGGGGCGATT GCTCTCTCGG CCCTTGAGCC CTCCGCCTCG 
CTGCTGTTTG GCGCCCTCCT GCTGATCTGG GGCGGCGTCG CGGGTAGTTT TTACGCCGTC 
GCGCTCGGCT ATCTCGGCGC GCGCTACAAA GGGCCGGAGC TCGCGAGCGC GAACGCTGCT 
TTTGTCATGC TCTATTCGGG CGGCATGCTG GGCGGGCCTC CGATCATGGG CGCCGGGATG 
GACGCGCTCG GGCCGCATGG ATTTTTTCTG GCGATCGCCG CGCTGCTTGC GATCTATCTT 
TTGATCGCGC GTCTCGCTGG CCCGCGCGAA GGCTCCGCGA AGCCCCGTTC TTGA

Protein sequence

MLNQPRRSSS GRAGGPFAAI ACAVATVAIV GVGLSLTMTL IAVRLGEQGF SARAIGINTA 
AAGFATLASA SFIPDLARRF GVGRLLFAAL ILCVLCLAAM AIRDDYWLWL GLRALFGVGL 
TVLFVLSEYW INAVAPPERR GAILGFYAAS VALGFAAGPL ILACVGTVGS APFLIAMALF 
AAAALPIVIG SKSAPAIETH SATPVLAFLL VAPVATLAGL LHGAIETASM GLLPVFALRS 
GLGAETGAWF VTLFALGNVA FQFPVGFLAD MIERRRLLMM IALVSLIGAI ALSALEPSAS 
LLFGALLLIW GGVAGSFYAV ALGYLGARYK GPELASANAA FVMLYSGGML GGPPIMGAGM 
DALGPHGFFL AIAALLAIYL LIARLAGPRE GSAKPRS