Gene Sde_0023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_0023
Symbol
ID	3968156
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	26674
End bp	27873
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	50%
IMG OID	637919082
Product	filamentous haemagglutinin-like protein
Protein accession	YP_525499
Protein GI	90019672
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTAACCT TAATAAAAGG TATTCTCAAC GGCTGTAAAC CAATCACGGA TGAAAATATG 
CTTAGTTCAA TTGAAGAGCT CATACTGTTT ACTCGCCTAC CAGGTGTAGG TGCGGCCACA 
TACTGGCAGT TGTTAGATCG CTTTCCTAGC ATACACTCTG CGCTGCAAGC CTCACCCGAA 
GCACTTAAAC CATTTCTCTC GCAAGAAGCC CTCGATACCC TAGCGTTGGT ACGCAGCCAA 
AAATCTGCCT CTATGGCTGT GCAGCAGGTG CAGCGGGATA TGGATTGGCT GCAAAAAAAC 
GACATTACCC TAGTAGATAC TGACCACACC GCCTACCCAG AGTTACTGCG CGAAATAAAA 
CGTACGCCGC CATTGCTGTA CGTCAAAGGT TGCCCGGCGA GTTTAAACTT TCCTCAGGTG 
GCCATTGTGG GCAGCCGCAA GCCCACGCCT GCTGGCCGCG ACACTGCTCA GGCCTTTGGC 
TCCGATTTGG CAAAATCGGG TTTTACCATT ACCAGTGGCT TGGCTATGGG TATTGATGCC 
GCCGCGCACG AGGGCGCCGT TAAAGTTAAA GGCCGTACCA TTGCAGTAAT TGGTACCGGC 
ATAGATAGCG TTTACCCCCA GCGCAATAGC GCATTAGCTA GCGAAATTAT TGCTAACGGT 
GGTGCAATAG TAAGTGAGTT CCCCTTGGGT ACCGACCCAC AACCGCAAAA CTTTCCACAG 
CGAAACCGTA TAGTTAGCGG TTTAAGTTTT GGTGTGGTGG TGGTCGAAGC GGCGGTAAAA 
AGTGGCTCTC TTATCTCTGC GCGCTATGCA TTGCAGCAAA ACAGAGAGTT GTTTGCGGTG 
CCTGGCTCCA TCCACAACCC TTTAAGTCGT GGTTGCCACG CATTAATAAA AGAAGGCGCC 
AAGTTGGTAG AAACCTCGCA AGATATTGTC GATGAGCTAG GCGGCTTCTT ATCGCGCCAG 
CGCGATTTAT TAGATATTTA CAAGCAGCCC GCAGAAAATA GTTTGCCAAA ACACGACGAG 
CTTATAGCTA ACGATTTAGA AGACGATGTA CTGGCAAAAC TAGATTACAG CCCAACCCCC 
ATCGACGCTT TAGCCGAGCG CACCAAAAAG CCCATTGGCG AAGTTATGTC TTGTTTGCTC 
ACCATGGAGC TAAAAGGCTT AGTGGCCAAC TTGGGTGCAG GCTATATGCG GTTGCGCTAG

Protein sequence

MVTLIKGILN GCKPITDENM LSSIEELILF TRLPGVGAAT YWQLLDRFPS IHSALQASPE 
ALKPFLSQEA LDTLALVRSQ KSASMAVQQV QRDMDWLQKN DITLVDTDHT AYPELLREIK 
RTPPLLYVKG CPASLNFPQV AIVGSRKPTP AGRDTAQAFG SDLAKSGFTI TSGLAMGIDA 
AAHEGAVKVK GRTIAVIGTG IDSVYPQRNS ALASEIIANG GAIVSEFPLG TDPQPQNFPQ 
RNRIVSGLSF GVVVVEAAVK SGSLISARYA LQQNRELFAV PGSIHNPLSR GCHALIKEGA 
KLVETSQDIV DELGGFLSRQ RDLLDIYKQP AENSLPKHDE LIANDLEDDV LAKLDYSPTP 
IDALAERTKK PIGEVMSCLL TMELKGLVAN LGAGYMRLR