Gene Sde_3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3031
Symbol
ID	3967695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	3871493
End bp	3872512
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	50%
IMG OID	637922128
Product	AraC family transcriptional regulator
Protein accession	YP_528500
Protein GI	90022673
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000013989
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000160975
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGCCG CACCTATCAA TACTAATCCG AGCAGCCGCG CCCTTACGGC CCCAGCACTC 
GAGGCGCTAG CGAACTACGC AGGGTGCAGA AACGCCACAA TCCACAGCAA AGGCGCAAAA 
ACAGACACGT TAATTAACGG CCATTTCACC TTAAAGCGGG AGTTCGATGG CATATTGGTG 
CATGCCTGCA ATATGGAAGA ACAAAAAGAT GCCCTAGTAG CCAGCCAGCA ACACGCTGGG 
CTTACCTTTG GTGTATTGAT AGAAGGGAAA ATAACGTTTG GCTTTAATGG AGAGTTCGGC 
ACTATAGAAG CTGCAAACGG CGCCCAGGGT TGGGCCACTA ACCTCACCCA AAACGCCGCA 
TGGCAGCGCA AACTGACCAA CAAGCAGCAA GTGATTAAAC TTGTGGTTTC TGTACCGCCG 
CAATGGATAA AACAGCACCT GTGGCAAAAC CCCGCCCCAG CCTTTTTAAA TAGGTTTATA 
AGCACCCATT TAGCGCGAAC ACATTGGCTG GCATCCGGCA GTTTAGTGCG CCACGCAAAA 
GCGGTAATGA GCAGCCACAG TAATAGCCCC AGTCAAGCCC TGCACTTCCA CGCCAATGTA 
CTCGCATTTA TTGCGCAAGC ACTGGACGAC ATTGAAGCCA GCGGCGAGCG CATTTTTAAC 
TTGCACAACC CTAACCGAAC CAGCCGGAGC CTTAGCAGCC AAGCTATAAA AGTGCAGCAG 
CATTTAGAGC ACTGCATTAA TGAGCTGCAG CCGGGTGCTC ACATTCAATT GGAAGATATA 
TCACATGCGC TGGGCATGAG TGTAAGCAAA TTGCAGCGTT TATCGAAAGC ACACTTTGGC 
TGCACTATTG CCGAGTACAT TCGTATTCGT CGCCTAGAAA AAGCGCGCCA CGAAATTCAG 
CACAACAATT TAAGTATTGG CGAAGCTGCT TTTTTAGCCG GCTATAATCA CAGGTCCAAC 
TTCTCTAAGG CTTTCAAACA ATATTTCAAT TTATGCCCCG GCGACATAGC GCCGCAGTAA

Protein sequence

MTAAPINTNP SSRALTAPAL EALANYAGCR NATIHSKGAK TDTLINGHFT LKREFDGILV 
HACNMEEQKD ALVASQQHAG LTFGVLIEGK ITFGFNGEFG TIEAANGAQG WATNLTQNAA 
WQRKLTNKQQ VIKLVVSVPP QWIKQHLWQN PAPAFLNRFI STHLARTHWL ASGSLVRHAK 
AVMSSHSNSP SQALHFHANV LAFIAQALDD IEASGERIFN LHNPNRTSRS LSSQAIKVQQ 
HLEHCINELQ PGAHIQLEDI SHALGMSVSK LQRLSKAHFG CTIAEYIRIR RLEKARHEIQ 
HNNLSIGEAA FLAGYNHRSN FSKAFKQYFN LCPGDIAPQ