Gene Sde_2038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2038
Symbol
ID	3967397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	2565220
End bp	2566413
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	47%
IMG OID	637921126
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_527510
Protein GI	90021683
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTCGC CCCTGCAAAC CTTATTTTTA CAGCTACACC AAGAGCTTGT TAGCAGTAAA 
TTGCTGTGGC AGCCGTCGCT TTTTGTAAAC CCATCCCCTT CTTGGCTAAA GCTCTACCCG 
GCTTTAACAG AGCAATGCCT AAGCTTAAGC GAAAACCAGC TCACCGAGCT AGAGCAACAA 
CCAGAGCTAA TCCCCCTGTG GCTTAGCGCA CACTTGCCAC ACATTACACA GCTTACTGCT 
CTAACCGAAC TAGAGATGAA CGCAAATTCA GCCACAGCGC TGCCCAAGCA GTGGGATGCT 
GGCATACCCG GCAGAAAAGC CAAGCAAATA AAAGCGTTTG CCGAAGCGTT CAAACCAGAG 
GGCGACATAC TTGTAGATTG GTGCAGTGGC AAAGCGCACC TAGGCCGAAC CCTTTCTGCG 
CTATATGCAG CCCCCTGCCT AGCCTTGGAA TATAACCCAA CCCTGTGCCA GCAAGGCAAT 
GTGTTAGCGC GTAAACGCAA CCTTAACACG CACTTTGTGG CAACCGATGT ACTTAAGCTA 
GGTGTAGCCT TACCTGCAAG CTCACATATT TGCGCCTTAC ACGCCTGCGG CGACCTGCAT 
AGAAGCTTGG TAGCCCAAGC TACAAGCCAC CCTGTTGCCG CCCTAACGTT TGCACCGTGC 
TGCTACCCAT TATGGCTAGA CGATACTTAC ACACCGCTTT CGAAAACTGC ACTTAAACAC 
AATTTGCAGC TAGACCGCAC AGATTTGCAT TTGGCTGTAC AAGAGTGCGT TACAGCTACA 
CCAAGAGAGC AAAGCCTTAG CCATAAACAA GCAACGTGGC GGTTAGGGTT TGATTGTTTA 
CAGCGAGACA TAAGACAAAG TGATAGCTAT TTAAACACTC CATCTTTGCC CCTTTCCGCC 
CTTAATAATG GCTTCGAGCA TTATTGCCGT ACATTAGCTG CATTAAAAAA TTTAACGCTA 
CCGCAAAATA TTCAATGGCA GCATTATGAA AAAGCAGGCG AAGTGCGCTG GGCAAAATTA 
CGCAGACTAC AACTAGTTCG CCATGCATAT AGGCGAGCGT TAGAGTTATG GCTGGTGTTA 
GATTTAGCAC TGCGCCTCGA AGAAGCGAAT TACACTGTAG TCATTAATCA GTTTTGCGAC 
CGGGCTTTAA CACCCAGAAA TATTATTATA AATGCTAAAT TAAACACGCA TTAA

Protein sequence

MPSPLQTLFL QLHQELVSSK LLWQPSLFVN PSPSWLKLYP ALTEQCLSLS ENQLTELEQQ 
PELIPLWLSA HLPHITQLTA LTELEMNANS ATALPKQWDA GIPGRKAKQI KAFAEAFKPE 
GDILVDWCSG KAHLGRTLSA LYAAPCLALE YNPTLCQQGN VLARKRNLNT HFVATDVLKL 
GVALPASSHI CALHACGDLH RSLVAQATSH PVAALTFAPC CYPLWLDDTY TPLSKTALKH 
NLQLDRTDLH LAVQECVTAT PREQSLSHKQ ATWRLGFDCL QRDIRQSDSY LNTPSLPLSA 
LNNGFEHYCR TLAALKNLTL PQNIQWQHYE KAGEVRWAKL RRLQLVRHAY RRALELWLVL 
DLALRLEEAN YTVVINQFCD RALTPRNIII NAKLNTH