Gene Sde_3569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3569
Symbol
ID	3966431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	4529593
End bp	4530603
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	48%
IMG OID	637922666
Product	membrane protein
Protein accession	YP_529036
Protein GI	90023209
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.325217
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTACC CCACTCGCCT TGCTGTAGGT TTATTTATTT ATGTTGCGTT AGCCTCTAAC 
GCATGGGCGC TATGGCATAG CGAAACCCAA GGAATAATGG GCACGGAAAT CTCCGTTACC 
TTATGGGATG AAAACCCCGA GCACGCCAAG CTTGCCATTA CATCGGTAAT GACCGAAATG 
GAGCGCATAA ACCAACTGCT TTCGCCCTAT CTAGAAACCA GTGAGCTGGC GCGCGTCAAT 
CGCGATGCAG CTACAGCCCC GCAAAAAATC TCTGAAGAAT TTTATTGGCT AATCCATCAC 
TCTTTACGCG TAAGTGCATT GAGCGGCGGA GCTTTTGATA TTACCTTCGC CTCTGTTGGT 
TGGCGTTACG ATTATCGAGC ACATCAACAA CCGCAAGAAA ATGAAATAAA AAATTTATTA 
CCCGCCATCA ACTATCGCTT GATTGTATTA GACGAAAAAA CACGCAGTGT ATTCTTTAAG 
CATAAAAATG TGCGAATTGA TTTGGGGGGT ATTGCTAAAG GGTACGCGGT TGATAACGCA 
ATTAAAATAC TGCGCACAAT GGGGGTCGAA CACGCTAGTG TTAGTGCCGG CGGGGATTCT 
TATTTACTGG GCGACAGGCA AGGTAGGCCG TGGGTAGTGG GCATTAAAAA CCCAAGGGCA 
GAGGATCCAG CCGCCAAAGC TGCGATTCGC ATTCCGTTAA CCGATACGGC TGTGTCTACC 
TCTGGCGACT ACGAGCGCTA TTTTATTGAT GAGCATACTG GCGAGCGCGT GCACCATATT 
CTAAACCCCA AAACCGGTAA GTCAGCTTCG GAAGTGACCA GTGTAACTAT ATTGGCGCCA 
CGGGGGTTAG ATTCAGACCC GTTATCTACA ACAGTATTTG TACTGGGAGT AGAAAAAGGG 
CTAGAGTTGG TCAACAGTTT GCAAGGAGTG GACGGCATAA TTATAGATCG CCAAGGTAAG 
GTGCATTACA GCGCCGGCCT CGCGCCAGCC GAAGCTGCAG CTGCAGACTG A

Protein sequence

MRYPTRLAVG LFIYVALASN AWALWHSETQ GIMGTEISVT LWDENPEHAK LAITSVMTEM 
ERINQLLSPY LETSELARVN RDAATAPQKI SEEFYWLIHH SLRVSALSGG AFDITFASVG 
WRYDYRAHQQ PQENEIKNLL PAINYRLIVL DEKTRSVFFK HKNVRIDLGG IAKGYAVDNA 
IKILRTMGVE HASVSAGGDS YLLGDRQGRP WVVGIKNPRA EDPAAKAAIR IPLTDTAVST 
SGDYERYFID EHTGERVHHI LNPKTGKSAS EVTSVTILAP RGLDSDPLST TVFVLGVEKG 
LELVNSLQGV DGIIIDRQGK VHYSAGLAPA EAAAAD