Gene Msil_0152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0152
Symbol
ID	7090468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	147236
End bp	148243
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	66%
IMG OID	643463485
Product	NADH dehydrogenase (ubiquinone)
Protein accession	YP_002360495
Protein GI	217976348
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0702] Predicted nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.274944
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGATC AGCTGATCAG GACGAAACGG CTTGCAGTCG TATTCGGCGG CTCGGGCTTC 
ATTGGCCGGC ACGTCGTTCG CGCGCTGGCC AAGGACGGCT GGCGCGTCCG CGTGGCGTCG 
CGTCGGCCCG ATCTTGCGTT CCATTTGCAG CCGCTGGGAA ACGTCGGCCA GATCCACGCC 
GTGCAGGCCA ATCTGCGCTA TCCCGACTCG ATTGAGCGCG CCCTGCGCGG CGCGGACGCC 
GCGGTCAATT GCGTCGGCAT TTTGAGCCCC GCGGGCGAGC AGACGTTTGA CGCGATCCAC 
GCCTCGGGCG CCGAGGCCAT CGCCAAGGCG GCAAAGGCGG CGGGCGTGAA ATCCTTCGTG 
CAAATCTCGG CGATCGGCGC TGATGACGCC AGCGCCTCCG CCTATGCGAA GACCAAGGCC 
CAAGGCGAGG CGCTCGTCGC CGCGGCCTTC CCCGGCGCGG TCATTTTGCG CCCCTCCGTC 
GTGTTTGGCC CAGAGGATGA ATTCTTTAAT CGCTTCGCCG CCATGGCCCG CTTCATGCCC 
GTTCTGCCGC TGATCGGCGG CGGCGAAACC AAGCTGCAGC CGGTGTTCGT CGGCGATGTC 
GCCCGCGCCG CGGCGCTTGC GCTCGACGGC AAGGCAAAGC CCGGCGCCAT CTACGAGCTC 
GGCGGGCCGG AAGTCGCGAC CATGCGCCGA ATCATGGAGT TCGTCTTAAA GGTGACCGAA 
CGCAAGCGGC GGCTCGTGAC GCTGTCCTTC GATCAGGCCA GAAGCGTCGG CGGCGTGACG 
GAAGTTCTCT CAAAACTGTC GCTCGGCCTG CTGCCCAAAA TGTTCGAGAT CACCCGGGAT 
CAGGTCGAGC TTTTGAAACA CGACAATGTC GTCTCGAAAG CCGCAATCGT CGAGGGACGG 
ACATTGCAGG GCCTTGGCCT GGCGCCGGAA TCCTTCGAGG CCTTCACGCC CACCTATTTG 
ACCCGCTACC GCGCGACCGG ACAATACGCC GACCGCCGCA TGGCCTGA

Protein sequence

MADQLIRTKR LAVVFGGSGF IGRHVVRALA KDGWRVRVAS RRPDLAFHLQ PLGNVGQIHA 
VQANLRYPDS IERALRGADA AVNCVGILSP AGEQTFDAIH ASGAEAIAKA AKAAGVKSFV 
QISAIGADDA SASAYAKTKA QGEALVAAAF PGAVILRPSV VFGPEDEFFN RFAAMARFMP 
VLPLIGGGET KLQPVFVGDV ARAAALALDG KAKPGAIYEL GGPEVATMRR IMEFVLKVTE 
RKRRLVTLSF DQARSVGGVT EVLSKLSLGL LPKMFEITRD QVELLKHDNV VSKAAIVEGR 
TLQGLGLAPE SFEAFTPTYL TRYRATGQYA DRRMA