Gene Sde_1121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1121
Symbol
ID	3968308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	1453046
End bp	1454617
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	47%
IMG OID	637920192
Product	hypothetical protein
Protein accession	YP_526595
Protein GI	90020768
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3934] Endo-beta-mannanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.258088
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGATG CGGTAGTTTG CTATAACTTT TACCTTATCG TTGTTAGAAT GAGTGTAACC 
GTTTACATTT GGCGTCTAAT TCATAAAAAG GGGAATACTG TGATTCTAAA GTTTCTAGGT 
TTGGCCGTAA CGTTCATGTG CGCAGGGTCG GCACTGGCAT TGGAGAACTT TATTACTCGT 
GACGGCCATC GATTGCTGGA TGGAGAGCAG GAGTTTCGCT TTGCAGGTAT TCACTTCCCC 
GAAATGCACC GTATAGAAAA TGACGCTGCT GGAGTGTGCA AATACGACCC CAGAGGCTGG 
GGGCAGCATT TTCAATGGCC CACCGAAGAC GAGCAAGAAA ACTGGGTGAA AGCCGCTGTG 
CGCACGGGCC ATAAGGCCAT GCGGGTATAT GTGCTGTCGG TGCAGCAAGC CAGCGACCAA 
GCCTGCGACA GGCAAACCCA TATTCTTGCA CCCGCCGAGC CCGGTGGCAT GCCCCGTTTA 
AGTGAGGCGG CCATGGTGCC TTACGACCGC ATGATTGCGC TTTCTGATAA ATACGGCCTG 
CGCTTAATTT TACCTTTTAT AGATCAATGG CCATGGTGGG GCGGGCGTGA GCAATTAGCT 
GCGTTTTATA ATGAGAAGCC AGAAGACTTC TACGACACCA GCAGTAAAAC CTATGCCGCA 
TACCAAAGTA TTATCAAACA GGTGTTAACC CGCAAAAACA CCTTTACTGG CCGCGAGTAC 
CGCGACGAAA AAGCGATTAT GGCGTGGGAG ACCGGCAACG AATTAAAAGA TACAACGGCG 
GATTTCTTAA GTAAAACAGC CGGTCTCATT AAATCGTTAG ATAAAAATCA TTTGGTGGTA 
GACGGCACCT ATAAAGCGAT TAACGATTTT GCCCTTGCCG ACCCCAATGT AGATATTATT 
TCAAATCACT ATTACGAAAA TGCAGGCAAC CTTTCGCCGC AAACCGTGCG CGCAGACCTA 
GAAGCTATAG GTGGTAAAAA AGCGTATTTA ATAGGTGAGT TTGGTCTACT CGACATTGAG 
CGTTTGCAGC AAATAATGGA TGCTGCAGTT AATGAAAATG TGAATGGTGC CAAAACCGTA 
GGCACCTTTA TTTGGGGGGG GCGAGGTCAT AGGCACAGCG GTGGCTTTTA TTGGCATTTA 
GAGCCTGCCA ACAATAAAAC CTACAGTTAC CATTTACCAG GTTTCAAGGA AGGGGCGCAC 
AACCAAGAAA TGCAAGTTGT GGATATGGTG CGGTTGGCAG CCGCGCAAAT GAATGGCGAG 
AAAAAAATGG CACCCCTACC GGTACCAGAA GCGCCAATAT TACGAGTGAT ATACCGCGCA 
GATAATGTTC GTTGGATGGG CGCGCCCACC GGCAGAAGTT ATCGCGTTGA GCGCGCAGAA 
AAAATAGATG GTAAATGGAA AGTCATTGGT AAAAATATTT CCGATGGCAA AAATAAATTC 
GACCCCAACA CCGATGCACT GTTTAGCGAT ACCGATAAAC TACAAAAAGG CAAAACCTAT 
TACTATCGCG TTATTGCCAT AAATGAATCA GGCGAGTCGC CGCCTTCTAA TATTCGCGCT 
TTAACTTATT AA

Protein sequence

MRDAVVCYNF YLIVVRMSVT VYIWRLIHKK GNTVILKFLG LAVTFMCAGS ALALENFITR 
DGHRLLDGEQ EFRFAGIHFP EMHRIENDAA GVCKYDPRGW GQHFQWPTED EQENWVKAAV 
RTGHKAMRVY VLSVQQASDQ ACDRQTHILA PAEPGGMPRL SEAAMVPYDR MIALSDKYGL 
RLILPFIDQW PWWGGREQLA AFYNEKPEDF YDTSSKTYAA YQSIIKQVLT RKNTFTGREY 
RDEKAIMAWE TGNELKDTTA DFLSKTAGLI KSLDKNHLVV DGTYKAINDF ALADPNVDII 
SNHYYENAGN LSPQTVRADL EAIGGKKAYL IGEFGLLDIE RLQQIMDAAV NENVNGAKTV 
GTFIWGGRGH RHSGGFYWHL EPANNKTYSY HLPGFKEGAH NQEMQVVDMV RLAAAQMNGE 
KKMAPLPVPE APILRVIYRA DNVRWMGAPT GRSYRVERAE KIDGKWKVIG KNISDGKNKF 
DPNTDALFSD TDKLQKGKTY YYRVIAINES GESPPSNIRA LTY