Gene MCA0212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA0212
Symbol	nifS
ID	3103373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	214241
End bp	215389
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	68%
IMG OID	637169435
Product	cysteine desulfurase
Protein accession	YP_112748
Protein GI	53802612
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.133802
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAGA CCTCGATCTA CCTGGACAAC AACGCCACGA CACGGCCGGC TCCGGAGTGC 
GTGGCGGCGA TGATGGCCTG CCTCCAGATG CATTATGGCA ACCCCTCCAG CAAGCATCGT 
CTGGGCGAGG CCGCCAAGAT GGAGGTCATC GCCGCGCGGG CCAGGCTCGC CGCGCTGCTG 
GGCGCCTCTC CGGCGGAAAT CGTTTTCACC AGCGGTGGTA CCGAATCCAT CCAGCAGGCC 
ATCCGCGGTG CGCTGGCCTT GGCGGCGGAC AAGCGCCGGG TGGTGACCAG CGCCGTAGAG 
CATCCGGCGA CCTTGCTTCT GCTGGAGCAT CTGGAAGCGC AGGGGCTCGA AGTGATCCGT 
CTGCCGGTCG ACCGGCAGGG GCGGCTTGAT CTCGCCATGC TGGATGCCGC GCTCACTCCC 
GATACCGGCT TGTTGAGCCT GATGTGGGCC AACAACGAGA CCGGCGTGCT GTTTCCCATC 
GCGGAAGCGG CGGCGCTGGC CGCGAGCCGG GGGGTACTGT TCCATTGTGA TGCGGTCCAG 
GCCGTAGGCA AGCTGCCCAT CGATTTGAGA CTGGTGCCGC TGGATTTCCT GTCCCTGTCT 
GGACACAAGC TGCATGGCCC CAAAGGCATC GGCGCGCTGT TCGTGCGCAA GGGCCGCAAA 
CTGCCGCCGC TGCTGTTGGG TCACCAAGAG CGCGGGCGCC GCGGCAGCAC CGAGAATGTG 
GTGGGCATCG TGGGGCTGGG CGTGGCGGCG GAACTGGCGG CGGAACATTT GGCGAGCGGG 
ATCGACGCCG TCGCCCGGCT GCGCGACCGC CTGGAAAGCC GGCTGCTCGC TGCGTTGCCG 
GGGGCTTCGG TGAACGGCGC CGGTGCGCCT CGGGTGGCCG GGACGTCCAG CTTCAATCTG 
GGGAATGTCG AAGCCGAGCT GGTGCTGGAC AAGCTGGACC GCGCCGGGGT CTGCGCCTCT 
GCCGGAGCGG CCTGCAGCGC GGGTGGTACG GAGCCTTCCC ACGTGTTGAC GGCGATGGGG 
CTGGGGAAGG AGGGAGCATT GGCCACCCTC CGTTTTTCAT TGAGCCGCTA CACCACCGTG 
GCCGAGGTGG ATGCCGTGTG CGGCCTGTTG CCGGGGATCG TGCGCAGCCT GCTGGCCGAG 
GCGGCGTGA

Protein sequence

MSETSIYLDN NATTRPAPEC VAAMMACLQM HYGNPSSKHR LGEAAKMEVI AARARLAALL 
GASPAEIVFT SGGTESIQQA IRGALALAAD KRRVVTSAVE HPATLLLLEH LEAQGLEVIR 
LPVDRQGRLD LAMLDAALTP DTGLLSLMWA NNETGVLFPI AEAAALAASR GVLFHCDAVQ 
AVGKLPIDLR LVPLDFLSLS GHKLHGPKGI GALFVRKGRK LPPLLLGHQE RGRRGSTENV 
VGIVGLGVAA ELAAEHLASG IDAVARLRDR LESRLLAALP GASVNGAGAP RVAGTSSFNL 
GNVEAELVLD KLDRAGVCAS AGAACSAGGT EPSHVLTAMG LGKEGALATL RFSLSRYTTV 
AEVDAVCGLL PGIVRSLLAE AA