Gene Sde_1550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1550
Symbol
ID	3965078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	1995367
End bp	1996518
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	42%
IMG OID	637920628
Product	AraC family transcriptional regulator
Protein accession	YP_527024
Protein GI	90021197
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0000434853
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGAAT GGCTAAAGTT TTTATTTATT TGCTCCCTTT GCTTGGGGGC GTGGACGAGC 
GTGAACCTTT GGGTGAATCA CGCTGGCCCT AAAAAAGTAC GCCAGTTTAC GGGCGTATTT 
GTGCTTGTAT TACTTGTTCC CCCTTTGGTT GGTTATTTGC AGCTGATTAG TGCAGAAATA 
CCTGCATTTT TTTCGTTTGT GCGTTCCACG CTTACATGGT GGTATGGGCC GCTTATGTAT 
TTTATTGCGC GTGAAATGTT GTTATTACCA AATACACCGC GTGGCATAGC GAACCATATG 
TGCGCAGTTT GTGGTTTGTT TGTGGTCACC CAATTATTAA TAAGTAGTGC AATACCCTAT 
GGTTATTTCG TTATAGTAAC CGCTGTGGTG GCTGCCTATT GTACGCTTGC GGGCCATACC 
TTAGTAAAAA ACGCATCGCG CTTACGCAGG CTTAATAGTA GCTATCGAAA ATCTACTTTT 
TATTGGTTGC AATATTTATT GGCAGGCTTG TTATTGCTGT GTGCAATGGA TATAGGTGTG 
CTAGTAGCTC TACACTCAAA TGTGCATTTA GACTTTTTAG CGCTCAATAG CATTGCATGC 
GTATTTGCTA TTTATGTAAA CGGTATAGTG TTATTTACTC TAATTAAACC CGCGCTTTTT 
GAACTAGATG ACGCACAAAC AATTGAACAC GTACAAACCA ATACAGGCGA GCAGCATAAA 
ATAAGCGAAG TCGCCGCAGA CGAATCACCA GCAGCCAAGA ATAATGTGCG TTACTTGGAG 
TTGAGTGATC AAGTTGCAAC TACGCTAATT AATACCCTTG CAACAATAAT GGAAACTGAT 
AAGCCCCACT TAGAGCCAGA CGAAAATTTA ACAAGCATGG CTGGGCGGTT GGGAATAACC 
ACGCACATGT TTTCTGAGCT TTTAAACGTA CACTTACATA CCAACTTTTA CGATTGGATG 
AATAGCTATC GCTTTAACGC CGCGCTGTTA TTACTGCAAG ATCAAACCGT AAATTACTCC 
GTAACCGATA TTGCTTTTCA GGCAGGGTTT AATAATAGGA ATAGTTTTTA CCGTGTGTTC 
AAATCGAACT TAGGCATTAC ACCCGCGCAG TATCGCAAAC AGTATAAAGC CGAATTGCAA 
AAGCAGGCCT AG

Protein sequence

MDEWLKFLFI CSLCLGAWTS VNLWVNHAGP KKVRQFTGVF VLVLLVPPLV GYLQLISAEI 
PAFFSFVRST LTWWYGPLMY FIAREMLLLP NTPRGIANHM CAVCGLFVVT QLLISSAIPY 
GYFVIVTAVV AAYCTLAGHT LVKNASRLRR LNSSYRKSTF YWLQYLLAGL LLLCAMDIGV 
LVALHSNVHL DFLALNSIAC VFAIYVNGIV LFTLIKPALF ELDDAQTIEH VQTNTGEQHK 
ISEVAADESP AAKNNVRYLE LSDQVATTLI NTLATIMETD KPHLEPDENL TSMAGRLGIT 
THMFSELLNV HLHTNFYDWM NSYRFNAALL LLQDQTVNYS VTDIAFQAGF NNRNSFYRVF 
KSNLGITPAQ YRKQYKAELQ KQA