Gene Msil_3786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3786
Symbol
ID	7090714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	4145196
End bp	4147202
Gene Length	2007 bp
Protein Length	668 aa
Translation table	11
GC content	65%
IMG OID	643467071
Product	Carbamoyl-phosphate synthase L chain ATP-binding
Protein accession	YP_002364030
Protein GI	217979883
COG category	[I] Lipid transport and metabolism
COG ID	[COG4770] Acetyl/propionyl-CoA carboxylase, alpha subunit
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.34193
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGGAA AGATCCTGAT CGCGAACCGC GGCGAGATCG CCTGTCGCAT CATCAAGACG 
GCGCGCCGGC TTGGCATTGC GACTGTCGCC GTCTATTCCG ACGCCGATCG CGACGCAAGG 
CATGTCGAGA TGGCCGACGA GGCGGTTCAT ATCGGTCCGG CGCCGGCGGC GCAAAGCTAT 
CTCATGATCG ACAACATCCT TGAGGCCTGC CGCAAAACGG GGGCCGAGGC CGTGCATCCC 
GGCTATGGCT TTTTGTCGGA GCGGGCGGCT TTCGCCGAGG CGCTGGCGAC GGAAAATATC 
GCCTTCATCG GCCCGAATGT CGGCGCCATC GCGGCGATGG GCGACAAGAT CGAATCGAAG 
CGCTTCGCGC GCGCCGCCGG CGTTTCGACG GTCCCGGGCA ATCTCGAAAT CATCAAGGAT 
GGCGCGGACG CCGCGCGCAT CGCCGCCGAC ATCGGCTTTC CGGTCATGAT CAAGGCGTCG 
GCCGGCGGCG GCGGCAAAGG CATGCGCATC GCAAGATCGG CAGGCGAGGT CGAGGAAGGA 
TTTGCGCGCG CCAAATCGGA AGCCAAATCC TCCTTCGGCG ACGACCGCAT CTTCATCGAG 
AAATTCATCG AAAATCCACG GCACGTCGAG ATTCAGATCA TTGGGGACAA GCATGGCCAT 
GTGATACATC TCGGCGAACG CGAATGTTCG ATCCAGCGGC GCAATCAGAA GATCATCGAG 
GAAGCGCCCT CCCCGCTGCT TGACGCAGCG ACGCGCGAAC TCATGGGCGC GCAGGCGGTG 
GCTCTCGCGC AAGCGGTCGG CTATGATTCG GCCGGCACCG TCGAATTCGT CGCGGGCCAG 
GACCGGAGCT TCTATTTTCT CGAGATGAAC ACCAGGCTGC AGGTCGAGCA TCCCGTCACC 
GAACTGATCA CCGGCCTCGA CCTCGTCGAG CTGATGATCC GCAGCGCCGC CGGCGAGCCG 
CTGCCCCTCG CGCAGGAAGA TGTGCGCCTC TCTGGCTGGG CCGTCGAAAG CCGCGTCTAT 
GCCGAAGACC CGACCCGCGG CTTCCTGCCC TCGATCGGGC GGCTCACAAC CTACCGTCCC 
CCGGCCGAAG GCAAATTCGG CGAGCTCACC ATCCGCAACG ATACGGGCGT CGCCGAAGGC 
GGCGAGATCG CGATCCATTA TGATCCGATG ATCGCCAAGC TCGTGACGCA CGCGCCGACG 
CGGAGCGAGG CGATCCACGG CCACAGCGCC GCGCTCGACG CCTTCGCCCT CGACGGCATC 
CGCCACAACA TCCCTTTTCT TTCGAGCCTC ATGTCCCATC CGCGCTGGCG CGAGGGGCGG 
CTCTCGACGG GGTTCATCGC CGAGGAATAT CCGGAAGGCT TCGCCAATCC GGCGCCTGCC 
GGCGCGATCG CCCTGCGCCT CGCCGCAATT GCGGGGGCGA TCGACCACCA GCTCAATCAA 
CGCAAGCGCC GGATTTCCGG GCAGATGCCG GTCGCCAAAG CGGTCACTTT CGAGCGCCGC 
CGCCACGTCG TCGTCGGCGC GGAAGACTTC GCCTTCGAGA TCGACGAAAC GCCAAAAGGC 
CTCAACCTTG CCTTTGAGGA CGGACGGCTG GTTTCGGTCC TCTCCTTGTG GAAACCGGGC 
GAACCGGTGT GGCGCGGCGT GGTCGACGGC GAACGCATCG CCGCGCAGGT CCGCCCCATT 
TTGAACGGCG TCCTGCTCGC ACATGGCGGA TTTTTTGCCG AAGCGCGCGT CTATACCCAG 
CGTGAAGCCG AACTCGTGCG GCTCATGCCG GAAAAACGCG CGGCGGACAG CGGCAAGCAT 
CTGCTCTGCC CGATGCCCGG CCTCATCCGC GAGGTTCTGG TGAGCGAAGG ACAGGCCGTA 
AAAGCCGGCG AAGCGCTGGC GATCGTCGAG GCGATGAAGA TGGAGAACAT CCTGCGCGCG 
GAACGCGACG CGACAATCGG CAAGGTCTAT GCGGCGGCCG GTCAGAGCCT TGCGGTCGAC 
GCCGTCATCA TGGATTTTGC GGCGTGA

Protein sequence

MFGKILIANR GEIACRIIKT ARRLGIATVA VYSDADRDAR HVEMADEAVH IGPAPAAQSY 
LMIDNILEAC RKTGAEAVHP GYGFLSERAA FAEALATENI AFIGPNVGAI AAMGDKIESK 
RFARAAGVST VPGNLEIIKD GADAARIAAD IGFPVMIKAS AGGGGKGMRI ARSAGEVEEG 
FARAKSEAKS SFGDDRIFIE KFIENPRHVE IQIIGDKHGH VIHLGERECS IQRRNQKIIE 
EAPSPLLDAA TRELMGAQAV ALAQAVGYDS AGTVEFVAGQ DRSFYFLEMN TRLQVEHPVT 
ELITGLDLVE LMIRSAAGEP LPLAQEDVRL SGWAVESRVY AEDPTRGFLP SIGRLTTYRP 
PAEGKFGELT IRNDTGVAEG GEIAIHYDPM IAKLVTHAPT RSEAIHGHSA ALDAFALDGI 
RHNIPFLSSL MSHPRWREGR LSTGFIAEEY PEGFANPAPA GAIALRLAAI AGAIDHQLNQ 
RKRRISGQMP VAKAVTFERR RHVVVGAEDF AFEIDETPKG LNLAFEDGRL VSVLSLWKPG 
EPVWRGVVDG ERIAAQVRPI LNGVLLAHGG FFAEARVYTQ REAELVRLMP EKRAADSGKH 
LLCPMPGLIR EVLVSEGQAV KAGEALAIVE AMKMENILRA ERDATIGKVY AAAGQSLAVD 
AVIMDFAA