Gene Sde_3209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3209
Symbol
ID	3965682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	4085115
End bp	4086335
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	46%
IMG OID	637922306
Product	hypothetical protein
Protein accession	YP_528678
Protein GI	90022851
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGATT TTTACCAGAA CGGTATAATT ACAACATTAC ATAATTTAAA ACAGCGCCCA 
CTAGAGGCCA TGGAAGACGA ACTGCGAAAA TTTTCCAAAA CTCGCCCTAT GGCCCTCGTT 
TTACCTTCGC TATTCTCCGA GCTAGAAGGC GATGCACTGC CCAATATTGT TAACGAACTA 
AGTAAAGTAG ATTACCTACA AGAAATAGTT ATTGGCCTAG ATCGCGCAGA CGAAGATCAA 
TACCGCCGCG CATTAGAGTT TTTTAAACCG CTCAAACAAA ATTTTAAAGT ACTGTGGAAC 
GACGGCCCAC GCCTGCGCGC CATCGACCAA CGCTTAAAAG ACGAAGGCCT AAGCCCTATG 
GAAGCCGGCA AAGGACGCAA CGTATGGTTT TGCTTGGGCT ATGTATTGGC AAGCGGCCAA 
TCGCAATCGG TAGCTCTGCA CGATTGCGAT ATAGTTACCT ACGATCGCAG CTTACTCGCG 
CGCCTTATTT ACCCCGTAGC CAACCCCAGC TTTAACTACG AGTTTTGCAA AGGTTTTTAC 
GCCCGCGTTG CCAACGGCAA AATTCACGGC CGCGTTAGCC GCTTATTGGT TACGCCATTA 
ATTCGCGCCT TGAAAAAAAC ACTGGGCCAC TACGATTATT TAGATTACAT CGACAGCTTC 
CGCTACCCAC TTGCGGGGGA GTTTTCGTTC CGCACCGATG TAATTACCGA CATTCGCATC 
CCCAGTGATT GGGGCTTAGA AATAGGCGTG CTTTCGGAGC TTAATCGCAA CTATGCCAAC 
AACAGAATAT GCCAAGCAGA TATTGCCGAC ACCTACGATC ACAAGCATCA AGATCTCTCG 
GCAGAAGACG CAGAAAAAGG CTTATCCAAA ATGTCTATCG ACATATCAAA AGCCCTATTC 
CGCAAGCTTG CCACCAACGG CGTAGTGTTT AACTCAGAAA CATTTCGCTC TATTAAAGCC 
ACCTACTTCC GCATAGCGTT AGATTTTGTA GAAACCTATT ACAACGATGC AGTAGTAAAC 
GGCCTTAAAT TAGATATTCA CAGCGAAGAA CGCGCAGTAG AATTATTTGC CCGCAATATT 
TTAGAAGCCG GCAAGCGCTT TCTTTCCAAC CCAATGGAAA AACCATTTAT TCCCAGCTGG 
AACCGCGTTA CCAGTGCAAT ACCCGGCATT TTAGAAGACA TAAATGCAGC GGTAGAAGCC 
GATATGGCAG ATTTTCAATA A

Protein sequence

MGDFYQNGII TTLHNLKQRP LEAMEDELRK FSKTRPMALV LPSLFSELEG DALPNIVNEL 
SKVDYLQEIV IGLDRADEDQ YRRALEFFKP LKQNFKVLWN DGPRLRAIDQ RLKDEGLSPM 
EAGKGRNVWF CLGYVLASGQ SQSVALHDCD IVTYDRSLLA RLIYPVANPS FNYEFCKGFY 
ARVANGKIHG RVSRLLVTPL IRALKKTLGH YDYLDYIDSF RYPLAGEFSF RTDVITDIRI 
PSDWGLEIGV LSELNRNYAN NRICQADIAD TYDHKHQDLS AEDAEKGLSK MSIDISKALF 
RKLATNGVVF NSETFRSIKA TYFRIALDFV ETYYNDAVVN GLKLDIHSEE RAVELFARNI 
LEAGKRFLSN PMEKPFIPSW NRVTSAIPGI LEDINAAVEA DMADFQ