Gene Sde_1759 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1759
Symbol
ID	3966665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	2246705
End bp	2247895
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	46%
IMG OID	637920842
Product	hypothetical protein
Protein accession	YP_527231
Protein GI	90021404
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATCGG TCATTAAACA AATTAATGCA GTAATAGTAA TGAGCCTAAA TAGCTTGCCA 
CAAAGGTTGT GGATGTCGCT TGCTACTTTA TTGGCGGTTG CCATTGTGGT GGCGGTGCTG 
CTGGCTTTTT TAGCTATGGG CAATGGGTTT AAAAAGACCC TAGAGAGCAC CGGCGCCGAA 
GATATAGTAA TAATGATGCG CGAAGGGGCA TCAGCCGAGC TAAACAGCGT ATTGATGCGC 
GACCAGGCCA ATTTAATTGA AGAGGCACCG GGTGTGCTAA ACGATGAGCA GGGCGCAATT 
GTATCGGGTG AAACCTATGT GATTGTTGAT GGTAAAAAAC GTTCAAGTGG CACCGATGCC 
AATATTCCTT TGCGTGGAGT ATCTAGCCGC GCGGTAGATA TTCGCGATAA CTTCAGCATT 
GTAAGTGGGC GTATGTTCGA GCCAGGCAAA AACGAGATAG TAGTAGGTAG CAGCATATTA 
TCGGAGTTTG CTGGCTTTGA ACTTGGCAGC GAAGTAAAAC TTGGCAACGC TAAATGGAAG 
GTGGTCGGTA TTTTCGATAC TGGCGGCTCG GTATTTTCAA GCGAACTATG GACAGATATA 
CGTGTAGTAC AAAGCCAATT TAATCGCGGT AGCAGTGTAC AAATTGTACG TGCCAAGCTT 
GAGTCCCCAG AGGCTATTGA GCAAGTAAAA GCGTATATAG CCGCAGATGC GCGTTTAAAT 
TTAGATGTGC AATCAGAGAA AACCTACTAT GGCGAGCAAG CAAAAAATGT TGGCGGTGTA 
ATAAACTATA TTGGCTGGCC ACTTTCTATT GCTATGGCGC TGGGTGCGTT GGCAGGTGCG 
TTAAATACTA TGTACACGTC GGTAGCGCAA CGATCAGTAG AAATAGCTAC TTTGCGCGCT 
ATTGGCTTTG GCAGTTTATC GTCTTTTTTA GGTACCTTAT TCGAGTCGGT AGTACTCTCT 
ATTCTCGGTG GTGTGCTCGG TACCTTTGCC GCATTCTTGT TTTTCGACGG TATGACAACC 
TCTACCTTAG GCAGTAGTTT TACTCAAATA GTTTTTAGCT TTGAAATAAG CAGCGACGCA 
CTAATAGACG GTGTTAGCTT AGCGCTAATA ATAGGTTTAG TAGGCGGCTT TTTCCCAGCG 
CTACGTGCAG CAAGGTTACC GGTAATTCTA GCATTTTCAT CGCAGGGCTA G

Protein sequence

MGSVIKQINA VIVMSLNSLP QRLWMSLATL LAVAIVVAVL LAFLAMGNGF KKTLESTGAE 
DIVIMMREGA SAELNSVLMR DQANLIEEAP GVLNDEQGAI VSGETYVIVD GKKRSSGTDA 
NIPLRGVSSR AVDIRDNFSI VSGRMFEPGK NEIVVGSSIL SEFAGFELGS EVKLGNAKWK 
VVGIFDTGGS VFSSELWTDI RVVQSQFNRG SSVQIVRAKL ESPEAIEQVK AYIAADARLN 
LDVQSEKTYY GEQAKNVGGV INYIGWPLSI AMALGALAGA LNTMYTSVAQ RSVEIATLRA 
IGFGSLSSFL GTLFESVVLS ILGGVLGTFA AFLFFDGMTT STLGSSFTQI VFSFEISSDA 
LIDGVSLALI IGLVGGFFPA LRAARLPVIL AFSSQG