Gene Sde_1249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1249
Symbol
ID	3968210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	1599354
End bp	1600343
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	49%
IMG OID	637920323
Product	pseudouridylate synthase
Protein accession	YP_526723
Protein GI	90020896
COG category	[S] Function unknown
COG ID	[COG0585] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00094] tRNA pseudouridine synthase, TruD family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.883014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.601505
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTTA ATTTAGATTT TGCCTACGCC CAAGGGCAGC CCACCCAGAC TGCCACCTTC 
CGCCAATTAG CGGAGGATTT TATTGTAGAT GAGCAGCTAG GCTTTGAATT TAGCGGTGAA 
GGTGAACACC TATATGTTCA AATTAAAAAA ACAGGCGAAA ACACGCAATA CGTTGCTAAA 
CAACTGGCGC GCTACTTGGG GGTTAAGCCG GTTGCGGTTG GCTTTAGCGG CCTGAAGGAT 
CGTCACGCTG TAACTACCCA GTGGTTTAGC GTGCAATTGC CGGGTAAAAA TATTGATATC 
GACTGGGCTG ACTTTATCGA AAAAACGCAG CTCAATGTGG AAGTATTACA GCAAGGGCGG 
CACAGCGCCA AATTGCGCCG CGGTCAGCAT TTATGTAACG ATTTTGTTAT TACTTTGCGC 
GATATTAGCC AAAGTGATGA CCTAGAAGCG CGATTGCAAA CTGTAGCGGC CAACGGTGCC 
CCCAATTATT TCGGTGAGCA GCGTTTTGGT ATTGATGGCG GTAACCTTGC GCGTGCGCAG 
GCGTGGTTTA GTGGTGAAGA CCCCATTCGC AACAAAAACA TGCAGGGTAT TATTTTATCT 
GCTGCACGCT CCTACCTGTT TAACCTAGTG CTTAGCGAGC GAATAAAGCA AGACAATTGG 
CTAGCGCCGA TGGACGGCGA CCCCGCAGAA GTACCAACTG GCCCACTATG GGGCCGCGGC 
CGACCTAAAT CGACCGATGC ATTGCTAGAG CTAGAAAACG AAGTACTGGC CCACTTGGAC 
CTATGGCGAG ATAAGCTCGA GCACAACGGT TTAAGCCAAG AGCGCAGAGA TTTAGTGCTT 
AAGCCTCGTT CATTCTCGTG GCAGTGGCAA GACAATGCCT TGGTACTTAG CTTGTCGTTG 
GCCCCTGGGC TATATGCAAC ATCGCTGTTG CGTGATGTAT TGCTATTGAA TAACGTTTCA 
GCAGAACAAT ACGCCCCTCC TGCAGCCTAA

Protein sequence

MSFNLDFAYA QGQPTQTATF RQLAEDFIVD EQLGFEFSGE GEHLYVQIKK TGENTQYVAK 
QLARYLGVKP VAVGFSGLKD RHAVTTQWFS VQLPGKNIDI DWADFIEKTQ LNVEVLQQGR 
HSAKLRRGQH LCNDFVITLR DISQSDDLEA RLQTVAANGA PNYFGEQRFG IDGGNLARAQ 
AWFSGEDPIR NKNMQGIILS AARSYLFNLV LSERIKQDNW LAPMDGDPAE VPTGPLWGRG 
RPKSTDALLE LENEVLAHLD LWRDKLEHNG LSQERRDLVL KPRSFSWQWQ DNALVLSLSL 
APGLYATSLL RDVLLLNNVS AEQYAPPAA