Gene Msil_0490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0490
Symbol
ID	7091223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	543248
End bp	544315
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	63%
IMG OID	643463820
Product	NMT1/THI5 like domain protein
Protein accession	YP_002360824
Protein GI	217976677
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACTCA CAGGCGCCGT CGGCGATCAC GCGCCGACGC GGAGACAGGC GGTCGCGCAA 
ATCTCCGCTT TTTGCGCATT AGGGTTTTCG CCGTCGAGGG GGGCGGCCGC CGTCCCGAAG 
ATTACAGTCG CTCTCGTCCG AAGCGCAGGG TCCGGCCCGC TCTTCATTGC GGCCGCAAAG 
GGATATTTCG CGGACGAAGG GCTCGATGCC GAGCTGCGCT TCGTTGCGTC CGATGATGAC 
GCGAGGGCCG CCGTCGCCGC AGGCGAGGCC GCCTTCGGCG TTTCGCAGCT GACAGCCTCA 
TTTTTCAGCT ATGCGGTAGA TCAGCGGCTG ACGCTGATCG CCTCGCAATT CAGCGATCAG 
GCGGGGTTTC CCGCCAATGC TCTCGTGATC GTCAAACCGG CCTATGACGC AGGGTTCAAA 
AGCGTCCCCG ATTTGCGGCG CAAACAGATC GGCCTCGAGG ATGTGGGATC TGGCCGTCGC 
TACGCCCTGG CGCATATCGC CGCGCGCTAC GGGCTAGATC CAGACGAGCT CACGATCGCC 
GCGCTTGAAA GGCCTCAAAG AGAATTTGAG GCGTTGCGCA AAGGCGAAAT CGACGCCGCC 
GTCGTTTCGT TTCACACGGC GCTCGAAACC GCCTCCTCCG CCAGCGATCT GGTTCTCGTC 
AGGATGGGCG ATCTGGCGCA GTCGCAAATG GGGGCGGTCT TCACGGCCCA GCAGACGATT 
GATTCAAACC GCCCGATCGT CGAGAAATTC ATCCGCGCCT ATCAGCGGGG CGTCGCCTCC 
TACGATCTTA CATTTCTTCA GCGGTCCGAC GGCGACGACG AAGCCAAGCC CGACGACTAC 
GACTCGACGT TGCAGCTGGT GTCTGAACAA GCGAATGTCG CGCCGCGCCT TATCGATCAG 
GCGCCTCTTT ATTGCGATCG CCTCGGGCGA TTGGACGAGG CCGACGTCTC GGCGCAGCTC 
GCATTCTGGC AAGACCACGG AATGGTCGCC CGAAGCGCGT CGGCAGCGAA TCTGATCGAT 
GGGTCCTTTA CCGCCGAGCG CCTGCCGGGC AATCCGGATC CGAACTGA

Protein sequence

MRLTGAVGDH APTRRQAVAQ ISAFCALGFS PSRGAAAVPK ITVALVRSAG SGPLFIAAAK 
GYFADEGLDA ELRFVASDDD ARAAVAAGEA AFGVSQLTAS FFSYAVDQRL TLIASQFSDQ 
AGFPANALVI VKPAYDAGFK SVPDLRRKQI GLEDVGSGRR YALAHIAARY GLDPDELTIA 
ALERPQREFE ALRKGEIDAA VVSFHTALET ASSASDLVLV RMGDLAQSQM GAVFTAQQTI 
DSNRPIVEKF IRAYQRGVAS YDLTFLQRSD GDDEAKPDDY DSTLQLVSEQ ANVAPRLIDQ 
APLYCDRLGR LDEADVSAQL AFWQDHGMVA RSASAANLID GSFTAERLPG NPDPN