Gene Sare_4747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4747
Symbol
ID	5705338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5371854
End bp	5372816
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	72%
IMG OID	641274145
Product	AraC family transcriptional regulator
Protein accession	YP_001539491
Protein GI	159040238
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000169446
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTCCGCT CCGTCGCCGT CATCGCCCTC GACCGAGTCG CCCCCTTCGA GCTCGGCGTA 
CTGGCCGAGG TCTTCGGCAC CGACCGCACC GCCGACGGCT TCCCGGGCTA CCGCTTCACC 
GTGTGCACCG TCGACGGTGG CCCGGTCCGC ACCTCGTCCG GCTTCCACCT CACCCCGCAC 
GGCGACCTGA CCGCGGTCGA CGAGGCCGAT CTGGTGGCCG TGCCCGCGCA CCCCCGGGAC 
TCACCTGTTC CGCCGGCCGC ACTCGCCGCG CTCCGCCAGG CTGCCGAACG AGACGCGTAC 
GTGTTCAGCG TCTGCTCCGG CGCCTTCGTA CTCGGCGCCG CCGGGCTACT CGACGGACGC 
GAATGCACCG CCCACTGGGC GCACGTCGAC GAGTTGCGAC AGCGCTACCC CGCGGCGAGG 
GTGCGGTGCA ACTCCCTCTA CGTCGCGGAC GGACGGCTGA TCACCAGCGC CGGCACCGCC 
GCCGGCATCG ACGCCTGCCT ACACCTGGTC CGGCAGGAAC ACGGGTCGGC GATCGCCACC 
CGGCTGGCCC GCCGAATGGT GGTCCCCCCA CACCGGGACG GCGGGCAGTC CCAGTACGTC 
GAGACCCCGA TCTCCAGCGA GCCCGAGGCG CAGACCCTGG AGCCGGTACT GCAATGGCTG 
ATGGGCCACC TGAACCGGTC GCTGACCGTG GACGACCTGG CCGCCCGCGC CGACATGGCA 
CCCCGTACGT TCGCCCGCCG GTTCCGGGCG GAGACCGGCA CCACACCGCA CGACTGGCTC 
ACCAACCAGC GGGTGTTGCT CGCCCGACGG CTCCTGGAAG AGACCCGTCT CAGCATCGAG 
GAGGTGGCCG GCCGTACCGG CTTCTCCGAC GCCGCTGCCC TGCGCCACCA CTTCACCCGC 
CGGGTCGGGA CCACCCCGAA CGGCTACCGC ATCACCTTTC GGGACCGAAC GCCTGCCCGC 
TGA

Protein sequence

MLRSVAVIAL DRVAPFELGV LAEVFGTDRT ADGFPGYRFT VCTVDGGPVR TSSGFHLTPH 
GDLTAVDEAD LVAVPAHPRD SPVPPAALAA LRQAAERDAY VFSVCSGAFV LGAAGLLDGR 
ECTAHWAHVD ELRQRYPAAR VRCNSLYVAD GRLITSAGTA AGIDACLHLV RQEHGSAIAT 
RLARRMVVPP HRDGGQSQYV ETPISSEPEA QTLEPVLQWL MGHLNRSLTV DDLAARADMA 
PRTFARRFRA ETGTTPHDWL TNQRVLLARR LLEETRLSIE EVAGRTGFSD AAALRHHFTR 
RVGTTPNGYR ITFRDRTPAR