Gene Sde_1661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1661
Symbol
ID	3965138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	2129078
End bp	2130079
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	47%
IMG OID	637920742
Product	AraC family transcriptional regulator
Protein accession	YP_527133
Protein GI	90021306
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000000000279685
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGTTT TGAAGCTTGT CCAAAGTAGT AGTCTCCCGG AGGCAGAAGA AGTTTATTTG 
CCGAGTCAAG ACAGTTACGA TATGAAGAGC CCGTTGGAGG CAATGGTCTA TTCATATCGT 
ATTCTAGCCC ACAGTTATAA ATACGATTCC TTCAACCAAG CGATAACCAG CCTGCTTGAT 
GCCGGTATTA AAAAGCTCGG CATGGAAACA GCATTGCTTA CGCGCCCAGT TTCGGCCCAA 
ATTTTTGAGG TTGTAGCCTG TGGTGGTAAG TGTGAAGGTT TCTATGTTGG TCAGCATTTA 
AGCCTGCAAG AAACACCTTG TTTGACTGTA TTTCAGAAAA ATGAGACGTG TGCATACACC 
AATGTTGAGC GGATGTGTGG CAAAGTGCCA GCTATGGCAT ATAATCAAAC ACAAGTAGGT 
GCGTATCTCG GAACCTACGT GCAGCCCCAC TTCGCTGAGC CGGGTGTAAT GTGTTTTACG 
GCGCCAGAAG CGAGGCTAAC GGAGTTTAGT GCCGAGGACG TGGTATTTAT CGAACTATTG 
GCTGAAGGAG TGGCCTTTAT GACTGATCAA CTAAGAGCGC AAGCTCAACG TAAGTTAACT 
GACCAGGCGA TGTTTGCCCT GGGTTCTGTG AAAACATTGG ATGAGTATCT CGAACAGGCA 
AGGTTGCCTG AGGTGTTTGG GGTGCCCGCA AGAGTAGTGG AGGTGCTTCA GCGCCGAATT 
GGTCATGCTC CCCTAAGTAT TGGCCACGTT GCGGAAGAGT TAAATCTTTC AAAACGTACT 
CTTCAGCGTC GCTTACAGCA GCAAGATGTA AACTTTGCTG AACTGCGTGA CCAAGTCCGG 
TTTCACTATT CCATCGATTA CCTTATTAAG CAGCATCAAA GCATCGACAG TATCTCTGCA 
TCGTTAGATT TTTCTGATCG AACTAGCTTT ACCAACGCCT TTAAACGTTG GACAGGTCTT 
TCTCCCAGTA CTTTTAGAAA GCTTTTCCGC GATTACGTTT AG

Protein sequence

MTVLKLVQSS SLPEAEEVYL PSQDSYDMKS PLEAMVYSYR ILAHSYKYDS FNQAITSLLD 
AGIKKLGMET ALLTRPVSAQ IFEVVACGGK CEGFYVGQHL SLQETPCLTV FQKNETCAYT 
NVERMCGKVP AMAYNQTQVG AYLGTYVQPH FAEPGVMCFT APEARLTEFS AEDVVFIELL 
AEGVAFMTDQ LRAQAQRKLT DQAMFALGSV KTLDEYLEQA RLPEVFGVPA RVVEVLQRRI 
GHAPLSIGHV AEELNLSKRT LQRRLQQQDV NFAELRDQVR FHYSIDYLIK QHQSIDSISA 
SLDFSDRTSF TNAFKRWTGL SPSTFRKLFR DYV