Gene Msil_1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1017
Symbol
ID	7091845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	1103844
End bp	1105004
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	64%
IMG OID	643464356
Product	2'-deoxycytidine 5'-triphosphate deaminase
Protein accession	YP_002361348
Protein GI	217977201
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0717] Deoxycytidine deaminase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.00286027
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAATCGC TTTTCCCGAA ACTGGATCAG GATGATTTCG GCCCGCATTT CGGACTGCTG 
TCCCGCCAGA AGATCGAGCT GATGGCGACG CGCCGCATGA TCCAGGCGGC GGACGCCCTT 
GACGAGCGAC AGCTTCAGCC GGCGAGCCTT GACCTGCGCC TCGGCGCGCG GGCCTATCGC 
GTGCGGGCCA GCTTCTTGCC GGGGCGCGAA CGCACGGTGA TGGAGCAGCT GCGCGCCTTC 
GCCCGGGACG AGGATGCAAT CAGCCTCGAA CAGGGCGCCG TGCTGGAGCG CGGCTGCGTC 
TATGTCATCC CGCTGATCGA GCATCTGCGC CTGCCCGACA GCATCGCGGC TTTCGCTAAT 
CCGAAAAGCT CGACCGGCCG GCTCGACATT TTCACGCGGC TCATCACCGA TAATTCGGAG 
GTGTTCGACC GCGTCGCCCG CGCCTATGAG GGGCCGCTCT ACGCCGAGGT GTCGCCGCGC 
AGCTTTTCGG TGCGCGTTCG CAAAGGATCG AAACTGAACC AGATCCGCTT CCGGCGGCTG 
AATTCGCAGC AGCTCGAACG CACCGGATTT GCGGTCGACG ATCGCGATCT ACGCGAACGA 
CACAAGGCGG CGTCCCTCGT CGACGGCGAG CTCAATTTGC GTCAGGGACT TGTCGTGCGG 
GTCGCGCTGA GCGCGGCGAT CCAGCCGGAC GGCGCCATCG GGTACCGCGC GCAAAAACAC 
GCCGACATCA TCGACGTCGA CCGCGCCGGC GGCTACCGGC TCGACGATTA TTGGGACAGG 
ATTTTCGCGC GGCCGGACGG GCGGCTCATT CTCGATCCCG GCGAGTTCTA CATCCTCGCC 
TCGCAGGAGC GCCTGCACAT TCCAAGCGAT CTCGCCGCCG AAATGGTGCC GATCGATCCG 
GCCATGGGCG AATTTCGCGT TCATTATGCG GGCTTTTTCG ATCCAGGCTT TGGCGCGTCC 
CCCGATAATC GTCCCGGCGC TCGCGCCGTG CTCGAGGTGC GCAGCCACGA GGTGCCCTTC 
GTGCTGGAGG ACGGCCAGAT CATCGGCCGG CTGGTCTATG AGAAAATGGC GGAGGCGCCG 
CATGCGCTTT ACGGCGAGGG AGAGGGCTCC AATTATCAGG GCCAGGGACT AAAGCTGTCG 
AAGCATTTTG TGATGGATTA G

Protein sequence

MQSLFPKLDQ DDFGPHFGLL SRQKIELMAT RRMIQAADAL DERQLQPASL DLRLGARAYR 
VRASFLPGRE RTVMEQLRAF ARDEDAISLE QGAVLERGCV YVIPLIEHLR LPDSIAAFAN 
PKSSTGRLDI FTRLITDNSE VFDRVARAYE GPLYAEVSPR SFSVRVRKGS KLNQIRFRRL 
NSQQLERTGF AVDDRDLRER HKAASLVDGE LNLRQGLVVR VALSAAIQPD GAIGYRAQKH 
ADIIDVDRAG GYRLDDYWDR IFARPDGRLI LDPGEFYILA SQERLHIPSD LAAEMVPIDP 
AMGEFRVHYA GFFDPGFGAS PDNRPGARAV LEVRSHEVPF VLEDGQIIGR LVYEKMAEAP 
HALYGEGEGS NYQGQGLKLS KHFVMD