Gene Sde_3153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3153
Symbol
ID	3965587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	4029857
End bp	4030951
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	45%
IMG OID	637922250
Product	AraC family transcriptional regulator
Protein accession	YP_528622
Protein GI	90022795
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGCGC ACCTAAGCTT AAGATTTTTT CTGTTATATC TTCTACTTAA AGCTTTGAAC 
TTTGGCTTTG AATGGTTGCT AGTGAACCCC GATACCCCCT ACAAAGCCGC ATGGCTGGCT 
TTGCTTATGG CCAGTTCATT TTTGATGGCG CCGTGCGTGT GGTTGCTTGC ACGGGAAATT 
GATCGCAATG CGCCACCGCG CTTATGGCCA ATTGCCTGGG GCCAATGCGC GGTTGTATTG 
GCGGGCTTTA TATTATGTAT ACCGCTATTT TTGGCAGCCA ATCAAAGCGT TTTGCTAGTA 
GATCCATCCC GTGCGAAACC CCACTGGTTC AATCTCACCC ATACCACCAT GGTAGGCGCA 
GTATTGCTTT ATCTCGTCCA AGTCCCCTGG TATTTATCGC GCAGCGTAAG CCTATTTCGC 
GAACGCCTAC GCATTAACAA GTTTTTATTT TCTAACATTG ATGAGCCGGC CCTTAACGCT 
TTGCGCGCTT TAATTTGGGT TATGGCTGCA AGCTGGCTGT TTAACTTACT ACGCATGCTG 
CATACGATGA TTTTAGAGCC ATCACAAGTA TGGAACCTGC TAATAAGCGC CTGTGAAATA 
GGGGTAACCA TTACGGCGCT GTACGTTATT TTTAAACGCT GTTGGCAATA CAGTGTTGAC 
GATCAAACTA TGGTTGAATC CGTAAGCCCC GAGCTAAAAG AACAGGCTTC GCTCCTACAG 
GGCGACAAGT GCGCCAAGTA CGCCAAGTCG TCGCTTGATC AAACTACACG AACTCGGGTA 
GCTAAAAAGA TTCTAGCTCA GTTTGAAGAA GAGAAAATAT ACCGTAAGAA TGGCCTAAAG 
CTGCAAGATT TATGCGTTGC CACAAATGAG AGCGCCCACT ATATATCACA GGTAATAAAC 
CAAGAGCTGG GGTTCAGCTT TTTTGATTTA GTGAACAAAT ATCGAATTGA AGAGGCACAA 
CAGAAGCTAA AACAAAATCG CGACCTACCT ATTTTAGATA TTGCCCTAGA GGTTGGGTTT 
AATTCGAAAC CTACTTTTAA TAAAGCCTTT AAACTGCGAG TTGGGCAAAC ACCCAGTGAA 
TTCCGAGCAA AGTAG

Protein sequence

MFAHLSLRFF LLYLLLKALN FGFEWLLVNP DTPYKAAWLA LLMASSFLMA PCVWLLAREI 
DRNAPPRLWP IAWGQCAVVL AGFILCIPLF LAANQSVLLV DPSRAKPHWF NLTHTTMVGA 
VLLYLVQVPW YLSRSVSLFR ERLRINKFLF SNIDEPALNA LRALIWVMAA SWLFNLLRML 
HTMILEPSQV WNLLISACEI GVTITALYVI FKRCWQYSVD DQTMVESVSP ELKEQASLLQ 
GDKCAKYAKS SLDQTTRTRV AKKILAQFEE EKIYRKNGLK LQDLCVATNE SAHYISQVIN 
QELGFSFFDL VNKYRIEEAQ QKLKQNRDLP ILDIALEVGF NSKPTFNKAF KLRVGQTPSE 
FRAK