Gene Sde_4002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_4002
Symbol
ID	3967421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	5038294
End bp	5039379
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	43%
IMG OID	637923099
Product	AraC family transcriptional regulator
Protein accession	YP_529469
Protein GI	90023642
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.24994
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAATG CAGCTAATAC GGTTAATAGC AAGATGGCTT ATACACAGGC GGCCTATTCG 
CAGGCGCTAA GCTCTAGCGC TCAAACGCAC TACCTGTTAC CCAGCGATAA AACCATCGTC 
GCGCATTGGC AGCCAGCCAT ATTGTTAAAT TTAATGTGCA ATAGTTTGGC TAATGAAGAA 
GCTATTGCGC TTTCTAATAA GCTTTTAAAG GGCACGCGCC TTTTTTATAG TGATTTTAGT 
AAAACAAACC TGTTTATTAG CCCGGAGCAG TTTCAACGTT TTATTGTAAA TTGCAATGCT 
ACCCCCAACC AATCCGATTT GGCATTTAGG TTTGGCCAAC GTTTATTGCC CGGTCATTAC 
GGTGATTTTT CCCACGGCTT AAACCAAGTA AACAGCGTAT TCGCTGCCGC AGAATTAATT 
CAAAAGTGCG CACATGTTTT CTCCCCATTG CTTACACCTA AGGTTAATGT GTATGCAACA 
GAATTAACAA TTAGCTTTTA TTCAAGCTAT GGCTGCGGCA ATAGCCACAG GTTTGTGTGC 
GAAGCATTTA TTTTTGCAAT TAAAAACTGG CTAGAGCAAC AACTGGGCAG GCACTTGCCT 
TGGCAATTTG AGTTTAACTA CACCGCACCA GAAGCCATAG AAAATTACGA AGTGTACCTA 
GGGGATAACC TTAAGTTTAA CCGACCCGTT ACCGCTATTC GCTTACCCAT TGAATATGCC 
CATAGCAGCT GGCAAGTAAG CGAGAATTTT ACTTTACCCT GCGCAGCCAC CCCAGTTAGC 
TTGCTAAATT TAGTGCGCCA ATTACTAAGA AACAACATAC AAGCCAACCC GAGTTTAGAG 
TGGCTTGCAC AACAGTTAGA CATTAGCCCC GCCACATTAA AACGACGCCT TAAAGCCTGC 
AATACGCAGT TTCGCGATTT ACTGAGCGAA ATTCGATTAG AAGTAGCGGT AGAACTTTAT 
CAGCAACAAC ATTTTAGCAG CGATGCCATT TGCCAATACT TGGGCTTTTA CGACGAATCT 
AATTTGCGCC GATTTTTTAA GCGCACCACC GGCCAAACAC ATACCCAGTA TTTGGCCTTA 
ACCTAG

Protein sequence

MLNAANTVNS KMAYTQAAYS QALSSSAQTH YLLPSDKTIV AHWQPAILLN LMCNSLANEE 
AIALSNKLLK GTRLFYSDFS KTNLFISPEQ FQRFIVNCNA TPNQSDLAFR FGQRLLPGHY 
GDFSHGLNQV NSVFAAAELI QKCAHVFSPL LTPKVNVYAT ELTISFYSSY GCGNSHRFVC 
EAFIFAIKNW LEQQLGRHLP WQFEFNYTAP EAIENYEVYL GDNLKFNRPV TAIRLPIEYA 
HSSWQVSENF TLPCAATPVS LLNLVRQLLR NNIQANPSLE WLAQQLDISP ATLKRRLKAC 
NTQFRDLLSE IRLEVAVELY QQQHFSSDAI CQYLGFYDES NLRRFFKRTT GQTHTQYLAL 
T