Gene Swit_3859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Swit_3859
Symbol
ID	5197979
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingomonas wittichii RW1
Kingdom	Bacteria
Replicon accession	NC_009511
Strand	-
Start bp	4245259
End bp	4246299
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	73%
IMG OID	640583414
Product	AraC family transcriptional regulator
Protein accession	YP_001264342
Protein GI	148556760
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTCCCC CCGCTCCCTT TCCATCGCTG ACCGTCGACG CGGTCCGCCC CCTGCTCGGC 
GTCATGGAAG CGGCCGGACT CGCCCCGGCG CATGTCCTGC GGCGCGCGGG CCTCCCGACC 
GACCTGTTCG CGGGGCCGGG AAACGGCGCG CTGCGCCTGT CCGACTATTT CCGCATCTGC 
GAGCAGATGG CGCTGCTCGG CGGCGACGAG AGCTGCCATG TCTCGCTGCG GCCGCTGATG 
GTCGGCACGT CCGAGCTGGT CCAGGCCCGG CTGCGCGGCT GCACGACGAT GGCGGAGGTG 
ATGGAGGTGC TGGCCAACAG CTACAACATC ATCCACGGCC ATCGCTACAA CCAGGTCCAG 
CGGCGCGGGC CGTTGATCAG CTACGCGATC GACGACGCCG ACTTCCCCTA TGCGTTCGAC 
CCGGACGACG CCTTCGTCAT CCTCTCGCTC GAATGCCTGC TCGTCTACGT CCATGTCCTG 
CTGCTATCGC TCGCGCCGGG CGCCGGGCCG ATCCCGCTCC GTTCGGTCCG CACCCGCGGC 
CCCGCCGCCG GCCGCAGCCA CCTCGCCTTC CTCGGCGTGC CGGTGAAGGC CTCGGCCGGC 
CTGTTCGGGC TCGACTATGA CGCGGCGCTC GAAGGCGTCG GCGTCGCCCC GGCGCAGAGC 
CCGGTGCTGT CGGCGCGCAC CATCTATGGC GGGGTCGCCG ACATGCTCGA CCGGATCGGG 
CCGGTCGCGG CGGACGCGCC CGACGTCATC GGCCGGGTCG AGCGCGAGCT CGCGCGCGGG 
CGGCTCGACC AGGCCGAGGT CGCGTCGGCG CTGGGGATGA GCGTCGCCTC GCTCCGCCGC 
CGGCTCGCCG AGGCCGGGCT CGCCTTCCGC GACCTGCGCG CGCGCTATCT GAACAGCATC 
GCGCGGGCGG CGCTGGAGGA CGGCGGCAGC ATCGCCGACA TCGCCGAAAC CCTCGGCTTC 
TCGGACGGAC GCAGCTTCGC GCGCGCCTTC CGCCAGTGGA ACGGCGTCGC GCCGGGGGAC 
TATCGCCGCA GCACCGACTG A

Protein sequence

MSPPAPFPSL TVDAVRPLLG VMEAAGLAPA HVLRRAGLPT DLFAGPGNGA LRLSDYFRIC 
EQMALLGGDE SCHVSLRPLM VGTSELVQAR LRGCTTMAEV MEVLANSYNI IHGHRYNQVQ 
RRGPLISYAI DDADFPYAFD PDDAFVILSL ECLLVYVHVL LLSLAPGAGP IPLRSVRTRG 
PAAGRSHLAF LGVPVKASAG LFGLDYDAAL EGVGVAPAQS PVLSARTIYG GVADMLDRIG 
PVAADAPDVI GRVERELARG RLDQAEVASA LGMSVASLRR RLAEAGLAFR DLRARYLNSI 
ARAALEDGGS IADIAETLGF SDGRSFARAF RQWNGVAPGD YRRSTD