Gene Msil_0640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0640
Symbol
ID	7093721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	694151
End bp	695407
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	68%
IMG OID	643463975
Product	glycosyl transferase group 1
Protein accession	YP_002360974
Protein GI	217976827
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0857805
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCAG GCTCAAGCTC ATATTTTCGT GACGGGACGG CGCATCCGCT CGCGGGCCGG 
AGCGTGCTCC AGATTGTGCC CGACCTCGAT GACGGCGCGG CGGCGCGCAC AACAATCGAG 
ATCGCGGCGG CTCTGACCCT CGTTGGCGCG AACGCCTTTG TCGCCGCGCG GGGCGGCAGT 
CTCGTGAGCG AATTGCAGGC GCGCGGCGGA CTGTTCGCGC CCCTTCCCGC AGACGCCAAA 
AACCCCCTCA CGATGGCGAT CAATGTGGAA AGGCTGGCGC GCCTTATCAA GGCGGAACGG 
ATCGATCTCG TGCATGCGCG CTCACGCGCC TCAGCTTGGT CAGCCTATGC CGCAACCCGC 
ATTCTGAAGA CGCCCTTTGT GACAAGCTTT GAAAGCTCCT ATGCCGTGGG CGGACCGCTC 
GCGCTGCGCT ACAATTTCGT GATGACGCGC GGCGACGCGA TCATCGCCGG TTCGGCCGAA 
GCGGCGCATG GCGCGGCGCA TCTCAATCCG GCGGCGAAAG ACAAAATTCA TGTCATCCTC 
GGCGGCGTCG ACTGCCGGGT CTTCTCGCCG AAATCGACGC CTCCGGCGCG GGTCCAGGCG 
GTCCGGCGGC TGTGGGGCGC CCCGCCCGAC GCCAGGGTGG CGCTGATCGC GCTCGGCCCC 
AAGCCCGCCG GAGACTGCAA GGCGGCGCTG GACGCCATCC GAATGCTGGC CGAGCAAATC 
CGCGCCGAAT CGTCTGACGC AGCCTTCGAC GTCTCGAGCC TTCGGGTCAT CATCGGCGCC 
GCCAGCGCCA CCGCAACGGA GATCAAGGAG ATCGACGCCA TCGTCGCGGA CTCCGGTTTG 
CAGGACATTG TGCAGCGGGG CGACATCGTT TCCGATCCGG CCGCCGCCTT GCTGGCCGCC 
TCGGTCATCA TGGCACAGTC GAGCAATCCG GCGGCCTTCG CGAGCCTCGC TCTCGAGGCG 
CAGGCAATGG GAGCGCCGAT CATCGCAACC ACAGGGGGGG CGGCCGCCGA AACTCTGCTC 
GCCCCGCCGG AGGTCGAGCC CAGCGCGCGG ACCGGCTGGC GCGCGCCGAC CGGCGATCCG 
GGCGCGAGCG CCATAGCGCT GAGTGAGGCA TTGAGCCTTG GCGCCACGGC GCGCGAACGG 
CTTTCGCTGC GCGGGCGCGC TCACGTCGAG CGGCGGTTCG CGATGGAGCT AATGTGGGAG 
CAGACGCTCG ACGCCTATGC GGCGGGGCTC GACGCCGTCC GTAAGCCGAC CAATTGA

Protein sequence

MSSGSSSYFR DGTAHPLAGR SVLQIVPDLD DGAAARTTIE IAAALTLVGA NAFVAARGGS 
LVSELQARGG LFAPLPADAK NPLTMAINVE RLARLIKAER IDLVHARSRA SAWSAYAATR 
ILKTPFVTSF ESSYAVGGPL ALRYNFVMTR GDAIIAGSAE AAHGAAHLNP AAKDKIHVIL 
GGVDCRVFSP KSTPPARVQA VRRLWGAPPD ARVALIALGP KPAGDCKAAL DAIRMLAEQI 
RAESSDAAFD VSSLRVIIGA ASATATEIKE IDAIVADSGL QDIVQRGDIV SDPAAALLAA 
SVIMAQSSNP AAFASLALEA QAMGAPIIAT TGGAAAETLL APPEVEPSAR TGWRAPTGDP 
GASAIALSEA LSLGATARER LSLRGRAHVE RRFAMELMWE QTLDAYAAGL DAVRKPTN