Gene Msil_3858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3858
Symbol
ID	7092554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	4226139
End bp	4227497
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	62%
IMG OID	643467143
Product	acetyl-CoA carboxylase, biotin carboxylase
Protein accession	YP_002364102
Protein GI	217979955
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0717744
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGAAA AAATCCTCAT CGCCAATCGC GGCGAGATCG CGTTGCGGAT TCTGCGCGCG 
GCCAAGGAGC TTGGCATTGC GACGGTCGCG GTCCATTCGA CCGCCGATTC CGAAGCAATG 
CATGTCAAGC TCGCCGACGA ATCCGTCTGC GTCGGGCCGC CGCCCGCTCG CGAATCCTAT 
CTCAACATTC CGGCTCTCCT CGCCGCCTGC GAGATCACCG GGGCCGAGGC GCTGCATCCC 
GGCTATGGAT TTTTGTCGGA AAACGCCCGC TTCGCGGAAA TCCTCGCCGA GCATCACATC 
GTATTCGTCG GGCCAAAGCC GGAGCATATC CGCCTGATGG GCGACAAGAT CGAGGCGAAG 
CGCACGGCGC TGCGGCTCGG CATCCCATGT GTGCCAGGCT CGGCCGGCGC CATCACGGAT 
GAGGCCGAGG CGAAGGCGGC GGCAAGAGAA CTCGGCTATC CTGTACTCGT CAAGGCGGCG 
GCGGGCGGCG GCGGCCGCGG CATGAAGGTT TCATTCAGCG AGGAGGACAT CGCCTCGACG 
CTGGAGACGG CGCGCATGGA GGCGAAGTCC GCCTTTGGCG ATGATTCCGT GTACCTTGAA 
AAATATCTCG AAAAACCCCG CCACATCGAA GTGCAGATTC TCGGCGACGG ACGCGGCGGC 
GCGATCCATC TTGGCGAGCG CGACTGCTCG CTGCAGCGCC GGCACCAGAA AGTCTGGGAG 
GAAGGCCCGT CCCCCGCGCT CAATGAGTCG CAGCGCAAGG AAATCGGCGA GATCTGCGCG 
GCGGCCATGC GCGAACTGCA GTATGCCGGC GCCGGCACGA TCGAATTCCT CTATGAGGAC 
GGCAAATTCT ATTTCATCGA GATGAACACC CGCATCCAGG TCGAGCATCC GGTGACCGAG 
ATGATCACCG GCGTCGATCT CGTCAATGAG CAGATCAAGA TCGCCGCCGG ATCGGCGCTG 
ACCTTGACGC AGGAAGACGT TTCCTTCAAC GGACACGCCA TCGAATGCCG CATCAACGCC 
GAACATCCGG CCACCTTCCG CCCCTCGCCG GGGATGATCA ATTATTACCA TCCGCCGGGC 
GGCCTCGGCG TCCGCGTCGA TAGCGCCGTC TACGCCGGCT ATACGATCCC GCCGACCTAT 
GATTCACTTG TCGGCAAGCT GATCGTGCAT GGCCGCAATC GCAATGAAGC GCTGATGCGC 
CTGCGCCGCT CGCTCGATGA GTTCATTATC GACGGCATCG ACACGACCAT CCCGCTGTTC 
CAGACGCTGG TGCGCAACGC CGACATCCAG AACGGGCTTT ACGATATCCA TTGGCTCGAA 
AAATTTCTGG CCGACGGCGG CATGGACGGC ACGGAGTAA

Protein sequence

MFEKILIANR GEIALRILRA AKELGIATVA VHSTADSEAM HVKLADESVC VGPPPARESY 
LNIPALLAAC EITGAEALHP GYGFLSENAR FAEILAEHHI VFVGPKPEHI RLMGDKIEAK 
RTALRLGIPC VPGSAGAITD EAEAKAAARE LGYPVLVKAA AGGGGRGMKV SFSEEDIAST 
LETARMEAKS AFGDDSVYLE KYLEKPRHIE VQILGDGRGG AIHLGERDCS LQRRHQKVWE 
EGPSPALNES QRKEIGEICA AAMRELQYAG AGTIEFLYED GKFYFIEMNT RIQVEHPVTE 
MITGVDLVNE QIKIAAGSAL TLTQEDVSFN GHAIECRINA EHPATFRPSP GMINYYHPPG 
GLGVRVDSAV YAGYTIPPTY DSLVGKLIVH GRNRNEALMR LRRSLDEFII DGIDTTIPLF 
QTLVRNADIQ NGLYDIHWLE KFLADGGMDG TE