Gene Msil_3219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3219
Symbol
ID	7090634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	3530987
End bp	3531982
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	65%
IMG OID	643466527
Product	protein of unknown function DUF58
Protein accession	YP_002363488
Protein GI	217979341
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.000742031
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAGTTT CCTACGCCGC TATAGGCCGC TCGTCTGGGC CGCGCCGCGT TCGTGAAACC 
TCTTCCTCTT CAAGGTTTGG TCGTTACATT TCCGTCGCCG ATCTCGTTGC GTTGCACGCG 
GCGGCGCGGG ACATTGGCTT CTTGTCGCGC CAGCGCACGC AGAGCGTGCT GTCGAGCCGG 
CGCCATCGCG GCTCCAATCT GCCGCCGACG TCCGGCGTTT TCGGCCCGCT GATGTCCGGC 
GATTTGTCGG GGGCCGACCA CCGGCGGCGC TTTGGGCGCT CGGCCGCGGA CGTCACCGCG 
TACGACGAGA CGCCGCCGAG GCCGATTTTT ATCGTCGTCG ACCAACGCCA ATGCATGTTT 
TACGGATCGC GCCGTTCGCT GAAATCCGTC GCAGCGGCGG AAGCCGCCGC ACTTTGCATC 
TGGCGCGCCC TCGACGACGG CGCGCCGATT GGAGGCGTGG TTTTCAACGA CGCCATTATT 
GAAGCCGTCG AGCCGTCGAC CGGCAGTTCC GCGGCGATGG CCATCATCAA GGCCATAGCG 
GGGCAAAACG CCGAGCTTCG CGCCAGGCCG GCGCAGCCGC GCGCGCCTTC GCAGCTCGAA 
AAAGCGCTTC GATCCGAACG GCTGGAGCAG GCGAGCGGCA GCCTCATCGT CGTCATCAGC 
GATTTTCAGG GCCATGGCGC ACACACGCGC GCCGCGCTGC AAAAGCTTGC CGAGGCCAAT 
GAGGTCGTCG CCGTCTGCGC CTATGATCCT TATCTGTTGG ACCTGCCGAA AACGGGCGAG 
ATCATCGTCA CCGGCGGCGA GGTGCAGATC GACCTCGAAT TCGGCCAAGG CCGCATCCGC 
AGGCGGCTGT TCGACTATGC CGACGCGCAG GCGCAGGGGC TGTTGACGAT CGAAAGGGAG 
ATTGGCGTGC CGGTGCTGTC CTTATCGGCG GCCGAGGACA CCTCGCTGCA AATGCGCCGC 
CTGCTGGACG AGAACGTCTG GCGCGTGCGC CAATAG

Protein sequence

MAVSYAAIGR SSGPRRVRET SSSSRFGRYI SVADLVALHA AARDIGFLSR QRTQSVLSSR 
RHRGSNLPPT SGVFGPLMSG DLSGADHRRR FGRSAADVTA YDETPPRPIF IVVDQRQCMF 
YGSRRSLKSV AAAEAAALCI WRALDDGAPI GGVVFNDAII EAVEPSTGSS AAMAIIKAIA 
GQNAELRARP AQPRAPSQLE KALRSERLEQ ASGSLIVVIS DFQGHGAHTR AALQKLAEAN 
EVVAVCAYDP YLLDLPKTGE IIVTGGEVQI DLEFGQGRIR RRLFDYADAQ AQGLLTIERE 
IGVPVLSLSA AEDTSLQMRR LLDENVWRVR Q