Gene MCA2884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA2884
Symbol
ID	3103932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	3076014
End bp	3077135
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	67%
IMG OID	637172012
Product	cysteine desulfurase
Protein accession	YP_115277
Protein GI	53803004
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCTACT TCGATCACAA CGCCACCACC CCGCTGGACG GGCGGGTGCT GGAGGCCATG 
CTGCCTTATC TGAAATCCTG CCACGGCAAT CCCTCCAGCC TGCACCGCCC CGGTCGTATC 
GCCCGCGACG CCGTGGAAAC CGCCCGCGCC CAGGTTGCCG CGCTGGTCGG CGCGACAGCC 
AGCCAGGTCG TGTTCACCAG CGGCGGCAGC GAAGCCAACA ACCTCGCCCT CAAAGGACTG 
GCCTGGAGTC TGAAACCCGG TCACATCCGC ATCGGCGCCA CCGAACACCC CTCTGTCGTC 
GAATCCGCGC GGCTCCTCGC CGGGCATGGC TGGGACTGTC GAACCCTGAC GGTGGACGCG 
CGGGGGCTGA TCGAAGATGC CGCCCTCGAC GCGATTGCGA AAAACCCGCC CGACATCGTC 
TCGGTCATGC TGGCCAACAA CGAAACCGGC GTGATCCAGG ATGTCGCCCG CATCGCCGCT 
TTGGCCACGG GCGCCTGGCT CCATTGCGAT GCGGTCCAGG CAGCAGGAAA GATCCCGCTG 
AACTTTGCCC GGACCGGCGT CCACCTGATG TCCCTGTCGG GACACAAGAT CGGCGGCCCC 
AAAGGAGCCG GCGCCCTGAT TGCCGACGCT TCGGTCCCCT TGACGCCGCT CATCCATGGC 
GGCGGACAGG AAAAGGGGCT GCGTGGCGGC ACCGAGAACG TGGCCGCCAT CGTCGGTTTC 
GGCAAAGCCG CAGAGCTTGC CGCATCGGAA CTGCAACAGC GCAGCCGGTG GCTTCGCCGG 
CTACGGGATC GCCTGGAGCA GGGCATCGAA AAACTCCCCG GCGCAACGGT CTTCGCCCGT 
ACCGCGGAAC GGCTGCCCAA TACCCTTCAG TTCGCCGTGG CGGGCTATGA CGGCGAGACC 
CTCGTCATGC TGCTGGACCG GCACGGCATC GCGGTTTCCA GCGGTTCAGC CTGCGCCGGC 
GGCGCACGCG AACCCAGCCC GGTGCTGCTC GCCATGGGAG TCGATCCGGC TCTGGCGACC 
GGCGCGGTAC GGATCAGTCT CGGCAAGGAC AACACCGAAG CGGAGGTGGA ACGACTGTTG 
ACCGCGCTCG GTCGAATCCT CGAAACAGGG CAGACCTATT GA

Protein sequence

MIYFDHNATT PLDGRVLEAM LPYLKSCHGN PSSLHRPGRI ARDAVETARA QVAALVGATA 
SQVVFTSGGS EANNLALKGL AWSLKPGHIR IGATEHPSVV ESARLLAGHG WDCRTLTVDA 
RGLIEDAALD AIAKNPPDIV SVMLANNETG VIQDVARIAA LATGAWLHCD AVQAAGKIPL 
NFARTGVHLM SLSGHKIGGP KGAGALIADA SVPLTPLIHG GGQEKGLRGG TENVAAIVGF 
GKAAELAASE LQQRSRWLRR LRDRLEQGIE KLPGATVFAR TAERLPNTLQ FAVAGYDGET 
LVMLLDRHGI AVSSGSACAG GAREPSPVLL AMGVDPALAT GAVRISLGKD NTEAEVERLL 
TALGRILETG QTY