Gene Apre_1637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1637
Symbol
ID	8398449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1779152
End bp	1780375
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	40%
IMG OID	644996001
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_003153379
Protein GI	257067123
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGATG TAGAAAAAAT TAGAGCTGAC TTTCCCTACC TTGATAGCGA AAAGGTGGGA 
AAGGAAGTTA TTTATTTAGA TACAGGAGCG ACAAGCCAGA AACCAGCCTA TGTGATTGAT 
GCAGTTGACG AATACTACAG ATATTCTAAC GCCAACCCTC ACAGGGGAGC CCACTTTCTA 
AGCTGGAAGG CGACAGAAGC TTACGAAGAA ACAAGACAAG TTGTCAAAGA CTTCATAGGA 
GCTAGAAAAT CTTCTGAGAT TGTATTTACA AGATCAACTA CAGAGGCCCT AAACCTCTTG 
GCCTACTCGT ATGGGCTAAA CAATCTCAAA AAAGATGACG AGATCCTAAT TACAATCCTA 
GACCATCATG CAAATCTAGT TCCATGGCAA ATGGTAGCAA AAAAGACTGG GGCAAAGCTA 
GTCTATGCCT ACCTAAATGA TGACTACGGC TTAGATTATG ATGATTTGAA AAGTAAAATC 
AACGAGAAAA CTAAGATAGT TTCTGTAACT GGAGCAAGCA ATGTTACAGG GGAGCTTATC 
GATTCAAAGC TTATTACTAA ATGGGCCCAT GAAGTAGGAG CCATATCAAT AGTAGACGGA 
GCCCAACTTA TACCTCATGT AAAGACAGAC GTCAAAGATA TAGATTGTGA CTTCCTAGCC 
TTTTCAGGAC ACAAGATGTT CTCTCCTATG GGAATCGGAG TCCTTTATGG AAAATACGAG 
CTTTTAGATA AGCTTGAGCC TTTCAACTAC GGCGGAGATA TGATAGAATA TGTCTATGAA 
CAAGAATCTA CTTTCCAAGA GCCACCTATA AAATTTGAAG CTGGAACTCC AAATGTAGGA 
GGAGTCCTTG GATTAAAAGC TGCGATTGAG TATGTAGAAA AAATTGGCAT GGACGAGATA 
TTTGCCTATG AGCATGAATT AACTTCCTAT GCCTATGATT TGATAAAGGA CATCCCAAAT 
ATCAAAATCT TCTATCCGAC AAATGGCAAG GCAGGATCTG TAATATCATT TACCTTTACA 
GACATCCACC CACACGATAT AGCTACAATC CTTGATAGCA AGGGGATAGC TGTAAGAAGC 
GGCCACCATT GTGCTATGCC ACTTCACGGA TATCTAGGCA TATCTGCAAC AGCCAGAGCA 
TCATTTTCTA TATACAATAC CAAGGAAGAA GCAGAGATTT TTGCTCGTGA GTTAAAGAAT 
GTAAGAAAGG TGATGGGCCT ATAA

Protein sequence

MMDVEKIRAD FPYLDSEKVG KEVIYLDTGA TSQKPAYVID AVDEYYRYSN ANPHRGAHFL 
SWKATEAYEE TRQVVKDFIG ARKSSEIVFT RSTTEALNLL AYSYGLNNLK KDDEILITIL 
DHHANLVPWQ MVAKKTGAKL VYAYLNDDYG LDYDDLKSKI NEKTKIVSVT GASNVTGELI 
DSKLITKWAH EVGAISIVDG AQLIPHVKTD VKDIDCDFLA FSGHKMFSPM GIGVLYGKYE 
LLDKLEPFNY GGDMIEYVYE QESTFQEPPI KFEAGTPNVG GVLGLKAAIE YVEKIGMDEI 
FAYEHELTSY AYDLIKDIPN IKIFYPTNGK AGSVISFTFT DIHPHDIATI LDSKGIAVRS 
GHHCAMPLHG YLGISATARA SFSIYNTKEE AEIFARELKN VRKVMGL