Gene Spro_3807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3807
Symbol
ID	5606918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	4206834
End bp	4208039
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	61%
IMG OID	640939364
Product	cysteine sulfinate desulfinase
Protein accession	YP_001480031
Protein GI	157372042
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily [TIGR03392] cysteine desulfurase, catalytic subunit CsdA

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000833089
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000586556
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACACCTT TTAATCCCAT CGTTTTTCGT AATCAGTTTC CTGCCTTGCA GCAAGCGGGC 
ATTTATCTCG ACAGCGCCGC CACCGCGTTG AAGCCGCTGG CGGTCATCAA TGCCACGCAG 
CAGTTTTACC GCGACGATGC CGCTACCGTG CACCGCAGCC AGCACCGGGC GGCGCAGGAT 
CTGACTGCAC GCTTCGAGCA GGCTCGCCAA CAGGTCGCGA CGCTGGTCAA TGCTCCTTCA 
GCCGACGACA TTATCTGGAC CCGCGGCACC ACCGAAGCGA TCAATTTGGT AGCGCAGAGC 
TATGCCCGCC CCCGGTTGCA GCCCGGTGAC GAAATCCTGG TGAGCGAGGC CGAACACCAC 
GCCAACCTGA TCCCCTGGCT GATGGTGGCG GAACAAACCG GCGCTCGGGT GGTAAAACTG 
CCACTGGGTG CAGACCGCCT GCCGGATCTG GCCCAGTTAC CCAGCCTGCT GAGTGATAAA 
ACCCGCCTGC TGGCACTGGG CCAAATGTCC AACGTCACCG GCGGCTGTCC GGATCTGGAT 
CTGGCCATCC GGCTTGCCCA TAGTGCCGGC GCTCTGGTGA TGATCGACGG CGCGCAGGGC 
ATCGTTCACT GTCCGGCTGA CGTTCAGCGA CTAGACATTG ATTTCTACGC TTTCTCCGGC 
CACAAATTAT ATGGCCCGAC CGGCATCGGT GCGCTATACG GTAAAAGCGA ATTGCTGGCG 
CAGATGGCCC CCTGGCAAGG CGGCGGCAAG ATGCTGACTC AGGCCTCCTT CGACGGCTTC 
ACGCCGCAAA AACCACCGCA CTGTTTTGAA GCCGGTACGC CGAATATCGC CGGTGTGCTG 
GGGTTGGCCG CCGCATTGGA ATGGCTTGGC ACCCAGGATC TGGCGGCAGC CGAGCAATAC 
AGCCGCGAAC TGGCCGATCT CGCCGAGAAA CAATTGGCGC AACTGCCGGG GTTCCGCAGC 
TTCCGTTGTT CGGGCTCCAG CTTACTGGCG TTTGATATTG CCGGTATCCA TCACAGCGAT 
ATCGTCACCC TGCTGGCAGA ACAAGGCATC GCACTGCGAG CCGGTCAGCA CTGCGCTCAA 
CCGCTGATGG CGGCGCTGGG TGTCAGTGGG ACACTACGCG CCTCCTTTGC GCCATACAAC 
ACGCGGGAAG ACGTCGATAC CCTGGTAACC GCCCTGCACA ACGCCATCGA CCTGTTGGCC 
GATTAA

Protein sequence

MTPFNPIVFR NQFPALQQAG IYLDSAATAL KPLAVINATQ QFYRDDAATV HRSQHRAAQD 
LTARFEQARQ QVATLVNAPS ADDIIWTRGT TEAINLVAQS YARPRLQPGD EILVSEAEHH 
ANLIPWLMVA EQTGARVVKL PLGADRLPDL AQLPSLLSDK TRLLALGQMS NVTGGCPDLD 
LAIRLAHSAG ALVMIDGAQG IVHCPADVQR LDIDFYAFSG HKLYGPTGIG ALYGKSELLA 
QMAPWQGGGK MLTQASFDGF TPQKPPHCFE AGTPNIAGVL GLAAALEWLG TQDLAAAEQY 
SRELADLAEK QLAQLPGFRS FRCSGSSLLA FDIAGIHHSD IVTLLAEQGI ALRAGQHCAQ 
PLMAALGVSG TLRASFAPYN TREDVDTLVT ALHNAIDLLA D