Gene Sde_3200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3200
Symbol
ID	3965673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	4076735
End bp	4078285
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	51%
IMG OID	637922297
Product	dystroglycan-type cadherin-like
Protein accession	YP_528669
Protein GI	90022842
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGCAA TCCTGTATCC TGCGCGCCCT TTAGTTGATG CAGACCCCAA TATGAAATTT 
GCCGAACTTG GCCTTTGTCC CGCCATTCAG AAAGCCGTAC TCGAACAAGG CTACGAAACC 
CCTACCCCAA TTCAAGCGCA AGCCATTCCC CCTGTATTAG AAGGGCGCGA TGTGATGGCC 
GCTGCGCAAA CCGGTACGGG TAAGACGGCG GGGTTTACAT TGCCCATTTT AGAAATACTG 
GCAGAAGGCA TAGAAAACGG CCGTAAAGTA AAGCCGAATC AGGCACGTGC GTTAGTACTT 
ACTCCTACGC GAGAGCTTGC AGCACAGGTA GGTGAAAACG TTGCCCTATA CGGCAAGTAC 
TTGCCTATTA AATCTACCAT CGTATTTGGC GGCGTGAAAA TTAACCCGCA AATGATGAAA 
TTGCGCGGCG GTGTCGACAT TTTAGTGGCC ACGCCAGGCC GTTTGATGGA CCTATACAAT 
CAGCGTGCAG TGAAGTTTGA TCAGCTAGAA ATGCTGGTGT TGGACGAAGC CGATCGCATG 
CTCGATATGG GCTTTATTCA CGATATTCGC AAAATTATGG CTATTTTACC GAAGAAACGT 
CAAAACCTGA TGTTTTCGGC GACGTTCTCG CAAGATATTC GCGAATTAGC TAAAAGTATT 
GTGAATAACC CAGTAGAAAT TACTGTGAAC CCGCCCAACA GCACCGCAAC CCGCGTAAAA 
CAGTGGATTT GCCCCGTTGA TAAAAAAGAA AAGCCCGCTT TGCTTACCCA TTTGATTAAA 
ACCAATAAGT GGCAGCAAGT GTTGGTGTTC TCTCGCACCA AGCATGGCGC AAATAAATTA 
GTTAAACAAT TGGAAGGCAG TGGCCTGCGA GCAGCGGCGA TTCACGGCAA CAAAAGCCAA 
GGCGCACGCA CTAAAGCGTT AGCCGAGTTT AAAAATGGCA CGGTAAAAAT TCTTGTAGCC 
ACCGATATTG CCGCTCGCGG TTTGGATATT GATCAACTAC CGCAAGTGGT GAACTTCGAC 
TTACCTCAGG TTGCTGAAGA TTACGTGCAT CGAATTGGCC GCACAGGCCG TGCTGGCGCA 
GAGGGCAATG CCGTTTCGCT AGTGAGTGCC GACGAATTTC AAATGTTAAA AGAGATTGAG 
CGTTTAACTA AAACGTTGCT CACTCGCGAA GTTATTCAAG GCTTTGAGCC AGACCACAAT 
TTACCTGAGT CTCGATTAGA TACCCGCCCC ATTCGCCCCA ATAAGCCGAA ACGGCCCAAG 
CCAGCAGGTG GTGCTTCGAA CCGCAGTGGC GGTGGTAACA GTGGCGGTGG CAATAATCGC 
GCTAAGCCGC GTGGCGATGA CAGCAAAGCG GCCAATGCCG ATACCCCGTG GGCAGGCAAA 
GCAAAGCCGC GCAAGCCTCG CCCTGCAGGT GCTAAACCCG CTACACAAGG TAAGCCTGCC 
GGCGCGCGCA ATGGCAATAC AGGCCCAAAA GGTAAGGGTG GGCCAGCCGG TGGGGGTGCC 
AGACGACCAA CTAATAAGCC TAGCGGTGCA CAAGGGGCTG CTAGAAGTTA G

Protein sequence

MAAILYPARP LVDADPNMKF AELGLCPAIQ KAVLEQGYET PTPIQAQAIP PVLEGRDVMA 
AAQTGTGKTA GFTLPILEIL AEGIENGRKV KPNQARALVL TPTRELAAQV GENVALYGKY 
LPIKSTIVFG GVKINPQMMK LRGGVDILVA TPGRLMDLYN QRAVKFDQLE MLVLDEADRM 
LDMGFIHDIR KIMAILPKKR QNLMFSATFS QDIRELAKSI VNNPVEITVN PPNSTATRVK 
QWICPVDKKE KPALLTHLIK TNKWQQVLVF SRTKHGANKL VKQLEGSGLR AAAIHGNKSQ 
GARTKALAEF KNGTVKILVA TDIAARGLDI DQLPQVVNFD LPQVAEDYVH RIGRTGRAGA 
EGNAVSLVSA DEFQMLKEIE RLTKTLLTRE VIQGFEPDHN LPESRLDTRP IRPNKPKRPK 
PAGGASNRSG GGNSGGGNNR AKPRGDDSKA ANADTPWAGK AKPRKPRPAG AKPATQGKPA 
GARNGNTGPK GKGGPAGGGA RRPTNKPSGA QGAARS