Gene Sde_3775 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3775
Symbol
ID	3966830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	4775707
End bp	4777329
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	47%
IMG OID	637922872
Product	helix-turn-helix, AraC type
Protein accession	YP_529242
Protein GI	90023415
COG category	[S] Function unknown
COG ID	[COG4104] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCGG CGCGACTCGG TGATATAGAT ACCGGTCACC CGCCCTCGCC CCCAACGCCC 
ATTATTAATG GCAGCACCAA CGTACTTATC AATTCTAGGC CGGCCGCGCG CAAAGGCGAC 
ATGCTGGTAC CGCACCACCC TGGTATTCGC AAAATTTCCG AAGGCTCTAG CAGCGTGCTT 
ATTAATGGCA AGCCTGCTGC GCGCATGCTC GATGGGGTAA ACTGCGGCGG TAAAATTATT 
ATTGGTTCTG GCAATGTATT TATTGGTGAT AACCCTAAAA CCGGTGGTGG TGGCGGGGTA 
ACCAGCAATA TAAAAGTAGA GCAAGAGTTT GATGAATATA TCGACTCGAA ATTCAAACCA 
GAAAACCAAA AGCTCACCGA CTACCAGTGG CGCCAACTAG AAGCCGATTT AGCGGTAAAA 
TACCGCGGCA GCGCAGGTGC CGTAGCTACC TGGGCAGAAT ATTATCAAGA GGCAATACCC 
GAAGGCCCAC CCCAATCTGC CGCCGAAGCC GAAGGCTTAA AAATAGCCCA AGCACTTAAT 
AGCGCAAGCG AGCTAGATGA GCCCGAAGCA GCCGTATACA GCGAAGAAGT GCAAGCCCAA 
GTAGACAAAG CCGGCCAAGC GCTGGCCCAA GCCGCCGCCC AACTCCCCGA AGGCGAAATG 
ATCACCCCCG AAATGGTACA CGTGGCCGAG CAAGCGCTGG CAGCTACTGG GTATGTAGAG 
CAGCCGCACT CGCACAATCA TCAAGCCAGC AAGGTTTCTG ATTTGGCCAG CCGTAAAGGC 
GTATCACCTA CATCGCTAGA TGATGCCGCT AACCGCTTAC AAAGCATGGG TCTAGAAATA 
AAAGAAAAAG GCTATCAACC CAAATACTCC GACGCAGAGT TAATAGCGCA AGCTAAGGCA 
GGAGACGTTG CTAAAGAGCG ATTCCATGTG CGGTTTATGG AGGTGCGCCA TCAGTGGAGC 
CGAGAAGATG CCGTTAAGAG CCAAGACAAC TTAACCGGCT TGCTCGGCCT GCCATTGCAA 
GGCAAAACGG GCGAGGGCGC AAAATACTGG TCGACAACCT TCGACCAAAT AGAAGATGCC 
GATACAGATG CAGAGCTTAT CTGCGGCATT TTGGGTTTAG ATTATAAAAA AGATGCCAAC 
TATATGATGG TTGTTGTCGA CACAGAAAAA GCGGCCCCGA TTACTGGCGT AGCAAGCGTA 
TCTGCAACAT TTGAAAATGT CAGCGAATTC GCCAATAGGG AACTGCCAGA TGAGTTTCCT 
AAGGACTTTA CTGACTTAAC CATGAATGAT GAATATCAGA AAAAATATAA CGAGCTATTT 
TCTGCTGCGA TTCAAGAGGG TGTTTTTGAA GACAAGTGGA AACCTAAAGA TGAGGAGCTT 
TCTAGCTTTC TCAAAAGTAG AGGTGTCGAT GATGATAACG TGGGTGTATT GGTTAACAGG 
CTGAAAATGC ACAGAATTAT AGGCAATAAT CAGTATTATG AGGGTAATGG ATTAACTCAA 
AATAAGAATG AAAAAGCTGG TAAAGAGTAT GGTGTGGTAG AAACATTAAA TTTCGAAAGA 
AAAAAAATAG ATCTACAAAA ACTAAAAAAT AGTGGTGCAA TTAAAATAAT AGCAATAGGT 
TAA

Protein sequence

MPAARLGDID TGHPPSPPTP IINGSTNVLI NSRPAARKGD MLVPHHPGIR KISEGSSSVL 
INGKPAARML DGVNCGGKII IGSGNVFIGD NPKTGGGGGV TSNIKVEQEF DEYIDSKFKP 
ENQKLTDYQW RQLEADLAVK YRGSAGAVAT WAEYYQEAIP EGPPQSAAEA EGLKIAQALN 
SASELDEPEA AVYSEEVQAQ VDKAGQALAQ AAAQLPEGEM ITPEMVHVAE QALAATGYVE 
QPHSHNHQAS KVSDLASRKG VSPTSLDDAA NRLQSMGLEI KEKGYQPKYS DAELIAQAKA 
GDVAKERFHV RFMEVRHQWS REDAVKSQDN LTGLLGLPLQ GKTGEGAKYW STTFDQIEDA 
DTDAELICGI LGLDYKKDAN YMMVVVDTEK AAPITGVASV SATFENVSEF ANRELPDEFP 
KDFTDLTMND EYQKKYNELF SAAIQEGVFE DKWKPKDEEL SSFLKSRGVD DDNVGVLVNR 
LKMHRIIGNN QYYEGNGLTQ NKNEKAGKEY GVVETLNFER KKIDLQKLKN SGAIKIIAIG