Gene Mnod_5845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_5845
Symbol
ID	7301107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	5945256
End bp	5946497
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	67%
IMG OID	643603463
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_002500976
Protein GI	220925674
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.187018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCAC CCGTCCTCCC GCCCTACGAC GTCGCGGCGA TCCGGTCGCA ATTCCCGATC 
CTGTCGCAGA CGGTCTACGG CAAGCCGCTC GTCTATCTCG ACAACGCCGC CTCGGCCCAG 
AAGCCGAAGG CGGTGATCGA CGCCATGGCG GAAGCCATGG AGACGGCCTA CGCCAACGTC 
CATCGCGGCC TGCACTTCAT GGCGAATGCC GCCACGGAAG GCTTCGAGGG CGCCCGCGAG 
ACCGCGCGGC AATTCCTCAA CGCCCGCTCG ACGGACGAGA TCATCTTCAC CCGCAACGCG 
ACCGAGGGCT ACAACCTCGT CGCCTCGTCG ATGGGCTGGG CCGGCCTGAT CGGGGAGGGG 
GACGAGATCA TCCTCTCGAT CATGGAGCAC CATTCCAACA TCGTGCCCTG GCACTTCCTG 
CGGGAGCGCC GCGGCGCGGT GATCAAGTGG GCGCCCGTCG ACGACGAGGG CAACTTCCTC 
GTCGAGGAAT ACGAGAAGCT GTTCACGCCG CGCACCAGGA TGGTGGCGAT CACCCACATG 
TCGAACGTGC TCGGCACGGT GACGCCGGCC CGTGAGATCG TCCGCATCGC CCATGCGCAC 
GGGGTGCCGG TGCTCCTCGA CGGCGCCCAG AGCGCGGTGC ACCAGACGAT CGACGTGCAG 
GATCTCGACT GCGATTTCTT CGTCTTCACC GGCCACAAGG TCTATGGGCC GACCGGCATC 
GGCGTGCTCT ATGGCAAGAA GGAATGGCTG GAGCGCCTGC CCCCCTATCA GGGCGGCGGC 
GAGATGATCC AGACCGTCAC GCAGGACGCG ATCACCTACA ACGAACCCCC GCACCGCTTC 
GAGGCGGGCA CCCCGGCGAT CGTCGAGGCG GTGGGCCTGG GCGCCGCCCT CGAATTCATG 
ATGAAGCTCG GCCGCGACCG GATCGCCGCG CACGAGGCCG CTCTCTCGGC CTATGCGCAT 
GAGCGCCTGT CCGAGATGAA CAGCCTGCGC ATCATCGGCC GGGCGAAGGG GAAGGGCGCC 
GTGATCTCCT TCGAGATGAA GGGCGCGCAT GCCCACGACA TCGCCACGGT GATCGACCGC 
CAGGGCGTGG CCGTGCGGGC CGGCACGCAT TGCGCGATGC CGCTGCTCAG CCGCTTCGGC 
ACGACCGCGA CCTGCCGCGC CTCGTTCGGG CTCTATAATA CGCCGGATGA GGTCGATGCG 
CTGGTCGCGG CCCTCGCCAA GGCCGAGATG ATGTTCGCCT AG

Protein sequence

MNAPVLPPYD VAAIRSQFPI LSQTVYGKPL VYLDNAASAQ KPKAVIDAMA EAMETAYANV 
HRGLHFMANA ATEGFEGARE TARQFLNARS TDEIIFTRNA TEGYNLVASS MGWAGLIGEG 
DEIILSIMEH HSNIVPWHFL RERRGAVIKW APVDDEGNFL VEEYEKLFTP RTRMVAITHM 
SNVLGTVTPA REIVRIAHAH GVPVLLDGAQ SAVHQTIDVQ DLDCDFFVFT GHKVYGPTGI 
GVLYGKKEWL ERLPPYQGGG EMIQTVTQDA ITYNEPPHRF EAGTPAIVEA VGLGAALEFM 
MKLGRDRIAA HEAALSAYAH ERLSEMNSLR IIGRAKGKGA VISFEMKGAH AHDIATVIDR 
QGVAVRAGTH CAMPLLSRFG TTATCRASFG LYNTPDEVDA LVAALAKAEM MFA