Gene Msil_3893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3893
Symbol
ID	7092590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	4270528
End bp	4271748
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	64%
IMG OID	643467178
Product	protein of unknown function DUF214
Protein accession	YP_002364136
Protein GI	217979989
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGATCC GCTTCCTGCT CGGAAGCCTT GCGCTGCAGA ATCTCGGCCG GCGCAAGGCC 
CGCACCGTGC TGCTGCTGGC CGCCGTCGCG ATCTGCAGCG GCGCCGTCTT CACCGGCGCC 
GTCCTGTTGC GCAGCATTGA AAGCAGCATG CTCGTCGGCT TCACGCGCCT CGGGGCCGAC 
ATGCTCGTGG TCCCGCAAGG AACGCTCACC AACTTAACGG CGGCGCTGTT GACGGCCGAG 
CCCACCGATC TCACGCTCGA AGACAACATG CTCGGCCGGC TGGCGGCGCT GAAAGGCGTC 
CGGCGCATCG GCCCGCAATT GATTTTTCGA ACAGACGCCT CCGGCTACGG GCACGGAGAC 
GAGCCGGTCG ATTTGATCGC TTTCGATCCC GCCCGTGATA TCACCGTCCA GCCATGGCTC 
GACAGTCGCC TTGATCGGCC CATGCGAGAA GGCGACGTCA TCATCGGCGG GCGCCGCGAG 
GAGCCGCTCG GCTCCGAAGT GCTGATCTTC GGCAAACCGC TCATCGTCTA TGGAAAGCTC 
GGGAAATCCG CGGTGGGGAC GCACGAGCGC GGGCTTTTCA TCGCTTTTTC GACGCTGAAC 
GACCTGCGGG AAATCATGGT GAACATCTGC GGGAAAAAGG CGCCGCTCGA GCCTCATAAG 
CTATCCGGGG TCCTCGTCGA ACTCGCGCCC GGCGCCACAA CGCAGCAGGT ACGGTTCGCC 
ATCCTGGCGA ACTTTCCCGA TGTCAAGGTC ATTGCCGGCG AATCGATGCT GACCTCCATC 
CGTCAAAGTC TCACCATCCT GCTCGACGGC GTGCTCGCAC TCATGCTCGT CATGTTCCTC 
AGCACGGCAT TGATGGTCGG CGTGTTGTTT TCGGTGATCA TCACGGAGCG GCGCCGCGAA 
CTCGGATTGC TCAAGGCGAT CGGCGCCCGT AGCGGGCAGA TCATCGGGAT GCTGCTCACA 
GAGGCGGCGC TCGCGACGGC CGCGGGCGGG CTGATCGGCT GCGCGCTCGG CCTGTTGCTG 
CTGCGTGGTT TCGAGCATTC GCTCGTCTAC TATCTCGCGA GCGTCGGAGT CCCATTTGTT 
TGGCTGAATA CGGGCGCTGT CATGCTGATC GCGTTCTCCT GCGTTCTGCT GGCTTCCGCG 
ACCGGGGCGG CGGGCGCATT CTACCCGGCG TGGCGGACCA GCCGCGAGCA GCCCTATGAT 
CTCATTCGAT CCGAAGGCTG A

Protein sequence

MGIRFLLGSL ALQNLGRRKA RTVLLLAAVA ICSGAVFTGA VLLRSIESSM LVGFTRLGAD 
MLVVPQGTLT NLTAALLTAE PTDLTLEDNM LGRLAALKGV RRIGPQLIFR TDASGYGHGD 
EPVDLIAFDP ARDITVQPWL DSRLDRPMRE GDVIIGGRRE EPLGSEVLIF GKPLIVYGKL 
GKSAVGTHER GLFIAFSTLN DLREIMVNIC GKKAPLEPHK LSGVLVELAP GATTQQVRFA 
ILANFPDVKV IAGESMLTSI RQSLTILLDG VLALMLVMFL STALMVGVLF SVIITERRRE 
LGLLKAIGAR SGQIIGMLLT EAALATAAGG LIGCALGLLL LRGFEHSLVY YLASVGVPFV 
WLNTGAVMLI AFSCVLLASA TGAAGAFYPA WRTSREQPYD LIRSEG