Gene GYMC61_3072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_3072
Symbol
ID	8526957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	3126489
End bp	3127709
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	58%
IMG OID
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_003254113
Protein GI	261420431
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTGA ACGAAATTCG CGCGTTGTTT CCGATTTTGC ATCAGGACGT CAACGGCCAT 
CCGCTCGTCT ATTTTGACAG CGCGGCGACG TCGCAAAAGC CGCTGCCGGT GATTGAGGCG 
CTTGACCGCT ACTACCGCGA GTACAACTCG AACGTCCACC GCGGCGTCCA TACGCTCGGG 
ACGAAGGCGA CCGACGCGTA CGAAGGCGCG CGCGAAAAAG TGCGGCGGTT TTTAAACGCC 
CAATCGGCGC AGGAAATCAT CTTTACGCGC GGCACAACCG CTGCGCTCAA CTTGGTCGCT 
GCAAGCTACG GGCGCGCCAA TGTCAAAGAA GGCGACGAGA TCGTCATCAC GTACATGGAG 
CATCACAGCA ACTTAATCCC ATGGCAGCAG CTGGCGAAAC AAACGGGCGC AACGCTGAAA 
TACATTCCGC TGCAGGAAGA CGGCACGATC GATTTGCGCG ACGTTGAGGC GACCATCACC 
AAAGCGGCGA AGATCGTCGC CATCGCCCAT GTGTCCAACG TGCTCGGGAC GATCAACCCG 
GTGCGGGAGA TCGCCCGCAT CGCCCATGAG CGCGGGGCGG TCGTCGTCGT CGATGCGGCG 
CAAAGCGCTC CGCATATGAA GGTCGATGTT CAGGAACTTG ATTGCGATTT TCTCGCCCTT 
TCCGGCCATA AAATGTGCGG GCCGACGGGA ATCGGCGTAT TATATGGCAA AAAGAAATGG 
CTTGAGCAGA TGGAGCCGAT CGAGTTCGGC GGCGAAATGA TCGATTTTGT CGAGCTGTAC 
GACTCGACGT GGAAAGAGCT GCCGTGGAAG TTTGAAGGCG GCACGCCGAT CATTGCCGGG 
GCGATTGGCC TTGGCGCAGC GATCGATTTC CTTGAACAAG TGGGCTTGGA CGCCATCGCC 
GCCCATGAGC ATGAGCTGGC GCAATATGCG CTTAGCCGAA TGGCGGACAT CGAAGGCGTC 
ACCGTCTATG GCCCGAAAGA GCGGGCGGGG CTTGTCACGT TCAACATCGA CGGGGTGCAT 
CCGCACGATG TGGCGACGGT CCTTGACGCC GAAGGAATCG CCATCCGCGC CGGCCACCAT 
TGCGCCCAGC CGCTCATGAA ATGGCTCGGC GTGACGGCGA CCGCCCGGGC GAGCTTTTAC 
CTTTACAATA CCAAAGAGGA AATCGACGCA TTCATCGCCG CATTACAGAA AGCGAAGGAG 
TACTTCAGCC ATGTCTTCTA A

Protein sequence

MNVNEIRALF PILHQDVNGH PLVYFDSAAT SQKPLPVIEA LDRYYREYNS NVHRGVHTLG 
TKATDAYEGA REKVRRFLNA QSAQEIIFTR GTTAALNLVA ASYGRANVKE GDEIVITYME 
HHSNLIPWQQ LAKQTGATLK YIPLQEDGTI DLRDVEATIT KAAKIVAIAH VSNVLGTINP 
VREIARIAHE RGAVVVVDAA QSAPHMKVDV QELDCDFLAL SGHKMCGPTG IGVLYGKKKW 
LEQMEPIEFG GEMIDFVELY DSTWKELPWK FEGGTPIIAG AIGLGAAIDF LEQVGLDAIA 
AHEHELAQYA LSRMADIEGV TVYGPKERAG LVTFNIDGVH PHDVATVLDA EGIAIRAGHH 
CAQPLMKWLG VTATARASFY LYNTKEEIDA FIAALQKAKE YFSHVF