Gene Sde_0022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_0022
Symbol
ID	3968155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	25495
End bp	26553
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	49%
IMG OID	637919081
Product	hypothetical protein
Protein accession	YP_525498
Protein GI	90019671
COG category	[S] Function unknown
COG ID	[COG1652] Uncharacterized protein containing LysM domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.124597
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT ACTTGCTTGG CGTGCTTTCT GCCATCGCCT TATCTGCGCA AGTCGCCACT 
CAAGCCTACG CGGAACAGCC TCAACTTCGC GATGAGATCC CAGCGACCCA TACAGTAGTT 
AAAGGGGACA CGCTGTGGGA TATTTCCGCG ACCTTCCTTA AGAATCCTTG GATGTGGCCA 
GAAATTTGGC ATGTAAATGC CCAAATTGAA AACCCGCACC TTATCTACCC TGGCGACGTA 
ATTCGCTTGA TCTATGTAGA TGGCAAACCA CGTTTAACGC TCGATACCAG CGGCCGCGTT 
TATAAAATGT CGCCTCAGGC GCGCGTTTTA TCTGCTGAAG AGGCCATTGA AACGATCCCG 
CTCGAAAAAA TTAACAGCTT TTTGTCACGC AGCCGCGTGG TTGGCGAAAA CGATTTTGTA 
GGCGCGCCCT ATGTGCTTTC TGGTTTAGAT CAGCACTTAT TGGTAGGCGC TGGCGATAAA 
ATCTACGGTC GCGGCAATTT TGCCGAGCGC GGCACGGTGT ACGGTATTTA CCGTCAGGGT 
GAAATCTTTA AAGACCCAGA AACCAAAGAG ATTTTGGGTG TACAGGCGCT CGATATCGCT 
ACTGCATCAT TAATGCGTGT AGAAGACGAT AACGATGCAA AAGACGATAT TGAAATTGGC 
ACCTTAAGTG TTTCTCGCAC CACAGAAGAA GTGCGTATCG GCGACCGCTT CTTGCGCCAA 
GAAGAACGCC CCATCGACTC GACTTTCTTC CCATCGGCCC CTAACACCGA AACCGAAGGT 
GTCATTTTGG CGGTTGAAGG CGGTTTAACC CAAGTGGGTA AAATGGACGT TGTTGTTATA 
AACCGCGGCG AGCGCGAAGG CATGACAGCA GGCACGGTAC TTGCCGTTTA CAAGCGTGGC 
GGTGTTATAC GCGACCGAGT GAGTAAAGAT AGAGTAACTT TGCCCGATGA GCGTGCCGGT 
GTTTTGATGA TTTTCCGCAC CTTCGAGAAA GTAAGCTTTG GCTTAATATT AGAAGCGGAG 
CGCGGCATTT CGGTAAAAGA TAAAGTACGC AACCCATAA

Protein sequence

MKKYLLGVLS AIALSAQVAT QAYAEQPQLR DEIPATHTVV KGDTLWDISA TFLKNPWMWP 
EIWHVNAQIE NPHLIYPGDV IRLIYVDGKP RLTLDTSGRV YKMSPQARVL SAEEAIETIP 
LEKINSFLSR SRVVGENDFV GAPYVLSGLD QHLLVGAGDK IYGRGNFAER GTVYGIYRQG 
EIFKDPETKE ILGVQALDIA TASLMRVEDD NDAKDDIEIG TLSVSRTTEE VRIGDRFLRQ 
EERPIDSTFF PSAPNTETEG VILAVEGGLT QVGKMDVVVI NRGEREGMTA GTVLAVYKRG 
GVIRDRVSKD RVTLPDERAG VLMIFRTFEK VSFGLILEAE RGISVKDKVR NP