Gene Msil_2471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2471
Symbol
ID	7091023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2698925
End bp	2699884
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	68%
IMG OID	643465792
Product	protein of unknown function DUF58
Protein accession	YP_002362762
Protein GI	217978615
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGT TCGCGCGCTT GCAATCGCAA TTCTCACGCA AAAATGATGC GCCAGCCTTT 
GCTGGCCGCG AGTCTGGCGA GAGCATTCCC GGCGTCGATC TCGACGTCGA TGACCTCTTG 
CGCATCCGTC ATCTCGCCGA GCGCATGGAT CTGCCGAAAT CTGCGCCGCG CTCGACCTTG 
CCCGGCAATG TGGCGCATCG CCGGCGCGGC CGCGGCCTTG AGGTGCATGA CATCCGGAGC 
TGGTCGGATG GCGACGACGT CCGCCATCTC GACCGCAATG TGATGGCGCG CACGGGAATT 
CCGCATGTGC GAACCTTTCG CGAAGAACGC GAACGCGCCG TTCTTCTCGT CGCGGACTTC 
CGGCCCTCCA TGCTGTTTGG CACGCGGCGC GCGCTGCGCT CCGTCGCGGC GGCGGAGGCG 
CTGACCCTCC TCGGCTGGCG CGCCGCCCGC GACGGGCGCG TCGGCCTGAT GGTCATTCAG 
CATGACGGCG GTCATCTGAT CCGCTACGGC CGCGGCGCGC GGGCGATGAT CGCCATGGTC 
TCCGAGCTCG CGCGGGCGCA TCGCAACGCG CTGGCGAGCC GCTCAAGGCT CGATCCGCCG 
CTGACCGAGA GCCTTGAGGA AGCCGACCGG CTCGCCGGCA AGAACGCCGC AATCGTCGTC 
GCCACTGCGC TGGACGAGCC GGGACCGCAG TTCGACGAGA TCGTGGCGCG GATCGCGCTA 
CGGCGCGATC TTTCCTTCGC GCTCATCGCC GACCGGTTCG AGACCGCGCC GCCGCAAGGC 
TCCTATCCTT ATGCAACAAT GGCCGGCGCT GCGGGTTGGC TGAGCATCGG CGCGAATGAG 
CCGCAAAAGC CGGACGAGCG CGTCGCCCGG CTGCAGCGGC TTGGCGCGCG CGCCTTGAGC 
CTCGATTCCC GCCTCGATGT CGAGGCGATG GCGCCGCTGC TGGAGCGTCT CGATGGCTGA

Protein sequence

MSLFARLQSQ FSRKNDAPAF AGRESGESIP GVDLDVDDLL RIRHLAERMD LPKSAPRSTL 
PGNVAHRRRG RGLEVHDIRS WSDGDDVRHL DRNVMARTGI PHVRTFREER ERAVLLVADF 
RPSMLFGTRR ALRSVAAAEA LTLLGWRAAR DGRVGLMVIQ HDGGHLIRYG RGARAMIAMV 
SELARAHRNA LASRSRLDPP LTESLEEADR LAGKNAAIVV ATALDEPGPQ FDEIVARIAL 
RRDLSFALIA DRFETAPPQG SYPYATMAGA AGWLSIGANE PQKPDERVAR LQRLGARALS 
LDSRLDVEAM APLLERLDG