Gene Msil_1950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1950
Symbol
ID	7094068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2125662
End bp	2127077
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	60%
IMG OID	643465277
Product	UBA/THIF-type NAD/FAD binding protein
Protein accession	YP_002362255
Protein GI	217978108
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	88
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCTC GCATAACCCT TGCGCTCTCG GGTGATCAGC ACGAGCACCT GATGAGCTTC 
CTGTTTCCGG GGGATGGCAA AGAGGCAGTT GCCATTCTAC TGTGCGGACG CCGCGATGGT 
GATCGCTGCC ATCGCCTTGT CGTCCGAGAG ATACACGGTA TTCCTTACGA CGACTGCTCC 
GAGCGGACGC CGTCGCGCGT CACATGGCCG CCAGATTACA TCGCGCCGAT GCTGGATCGG 
GCTGCCGCCG AGCGTCTTTC GGTCGTCAAA GTTCACAGTC ATCCGACCGG CTATGGCGCA 
TTCTCCACAA CCGACGACGC GGGCGACGCA CGCCTCCTGC CGATGGTCCG TGGATGGGTC 
GAGGCCAATG TCTTTCACGG CAGCGCAGTC ATGTTGCCTT ACGGCCAGAT GTTCGGGCGC 
GTCATGTTGG ACGACGGCAG CTTTGCGCCA ATCGACTGTA TCTCTGTGGC AGGCGACGAC 
CTTCTTTTTT GGTATGCGGA CGCGGGAAGC GTTGCCTTGC CGAACTTCGT CGCATCTCAT 
GCGCAAGCCT TTGACGAAGG AACAATCCAG CGGCTCCGCC GCCTTTCGTT TGCCGTGGTC 
GGGGCCTCCG GCACCGGAAG CCCGACTGTT GAACAGCTCG TCAGGCTGGG CGCTGCTGAA 
ATCGTGATTG TTGACGATGA TTACATGGAG GATCGCAACG TCAACCGTAT CCTGAACTCC 
ACAATGCAAG ATGCGAGTGA CAGTCGGACG AAAGTCGACG TGCTCGCGGA TGCTGCCGAG 
CGGATCGGCC TTGGAACCCG CGTCGTTCGC GTGCGCAAGA ATCTCTGGCA TCCCGATGTC 
ATTCGAGAAG TCGCACAGTG CGACGTGATA TTCGGCTGCA TGGACACGGT CGATGGTCGC 
TACCTCCTCA ACGCGCTCGC CTCATATTAC TCGATCCCAT ATTTCGATAT TGGCGTGCGC 
CTCGATGCGG TCCGGGACGG CGCTGGGAAA GGTCGCATCC GCGAAGTCTG CGGCACCGTC 
AACTACCTTC GCCCTGGTCG CTCCAGTCTT ATGAGCCGGG GTCTGTTCAC GATGGGCGAG 
GTCGCCGCGT CGGGCCTAAG GCGTAATGAT CCGCGCGCCC ATGAGCGCCA GGTCGATGAC 
GGATACATTA AGGGAGTTGC GGCGCATCGC CCTGCGGTAA TCAGCGTGAA CATGTTTGCA 
TCCGCGCTTG CCGTGGATGA GTTCCTCGCC CGTCTCCATC CCTTCCGCGA AGAGCCGAAC 
GCAAGCTATG CGAGCGTAAC GTTCAGTCTC GCCAGCATGG AGCTGATCTG CGATCCTGAA 
GAGGGCATCT GCGAAATTCT GGGCGGCGCT GTTGGCATCG GCGACACATC CCCGCTTCTA 
GGGATAATGG AACTCGCTGA AAGGCGGGTG TCGTGA

Protein sequence

MSARITLALS GDQHEHLMSF LFPGDGKEAV AILLCGRRDG DRCHRLVVRE IHGIPYDDCS 
ERTPSRVTWP PDYIAPMLDR AAAERLSVVK VHSHPTGYGA FSTTDDAGDA RLLPMVRGWV 
EANVFHGSAV MLPYGQMFGR VMLDDGSFAP IDCISVAGDD LLFWYADAGS VALPNFVASH 
AQAFDEGTIQ RLRRLSFAVV GASGTGSPTV EQLVRLGAAE IVIVDDDYME DRNVNRILNS 
TMQDASDSRT KVDVLADAAE RIGLGTRVVR VRKNLWHPDV IREVAQCDVI FGCMDTVDGR 
YLLNALASYY SIPYFDIGVR LDAVRDGAGK GRIREVCGTV NYLRPGRSSL MSRGLFTMGE 
VAASGLRRND PRAHERQVDD GYIKGVAAHR PAVISVNMFA SALAVDEFLA RLHPFREEPN 
ASYASVTFSL ASMELICDPE EGICEILGGA VGIGDTSPLL GIMELAERRV S