Gene Sare_0010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0010
Symbol
ID	5707391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	14087
End bp	15292
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	67%
IMG OID	641269534
Product	XRE family transcriptional regulator
Protein accession	YP_001534937
Protein GI	159035684
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.141867
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00323142
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAGCCGA GGCACGACCC GATACCGCCC GGTGGGCGGA TCAAGCTCTA TCGCAGGCGG 
CGCGGGCTCA CCCAAGAGGT GTGCGCCCAA CTCAAGGGTG TCAGCGTGGG CGCCTGGCGG 
AAGTGGGAAT CCGGGGAGCG GTCGGTCAAC AGTCTGGCTG ACTGGATCGA GATTGCTCGG 
ATTCTCAATG TTCGTGACCT CTACAAACTC ACCGGCCATC CGCTCGGGGT ACTGCCCGAT 
GACCCGGCCG AACATGAGTC GGTGCCGCCG CTACGGGCGG CGATGACCGC CTACGCGCCT 
GATATTGACC AGCTATCAAG CGTCGCCGAG CTACGGTCGG CAGTCAGACT GGCGTGGACG 
ACGTGGTACC AGTCGCGGCA GCGCTACACC TACACCAGCC CGGTCCTACC GGGCCTGGTC 
CACGCATCCC GGGCCGCGGT TGCCAGCCTC GACGGCAACG AGCGACGGCA AGCCCAGCGG 
GTCGCGGCCG ACCTGTACCT ACTCGTCCGG GCGTTCGCGA AGAAGGTCGG CGCGCAGGAT 
CTCGCGGTCA TCGCCGCCGA CCGGGCGCTG ACAGCCGCAT ACGAGGCCGA TGATCCCGCC 
TACCGGGCGT CCGCGGCGTG GAACATGGGC CAGGTGCTCT CCAATCGAGG GCATACCGAG 
GATGCGGTGG ACATGTGCCG GCAGGCCATC GCCGACCTGC AACGCACCGC CGACGACGAC 
CCTGTTCGCC TCGCGGCACT CGGCGGGCTG CACCTGCTGC TGTCCATCCA GTACGCCCGA 
CTGCGAGACG AACGACGAAC CCTTGACGTG CTTGATCGTG CCGACGAACT TGCGGCCCGC 
ACCGGGGAGA CAGAGCACCA TTTCATCTTC TTCGGTCCGA CCAATACGGC GATTCACCGC 
GCCGCCGCAA CACTGGAACT ATCCCGACCG GGGGAGGCGG CGCGAATCGC GGAGCGGGTC 
GACGTGGGTC GGTCGCCGTC GATTGAGCGG CGGCACTCCC ATCTCACTCA CCTGGCGCGG 
GCGTACGCCA GCAAGCGCGA TGACTACGCC GCGATCCACA TGTTGCAACG CGCGCACCGG 
GAGTCCCCCG AGGAATCATC GTTGAACCTA CTCATGCGGG GGACGGTACG GGAGCTGCTG 
ACCAGGGAGA CTGCCACCAG TCGGGACGAA TTGCGCGGTC TCGCGGAGCT GGTAGGCGTG 
GTCTGA

Protein sequence

MEPRHDPIPP GGRIKLYRRR RGLTQEVCAQ LKGVSVGAWR KWESGERSVN SLADWIEIAR 
ILNVRDLYKL TGHPLGVLPD DPAEHESVPP LRAAMTAYAP DIDQLSSVAE LRSAVRLAWT 
TWYQSRQRYT YTSPVLPGLV HASRAAVASL DGNERRQAQR VAADLYLLVR AFAKKVGAQD 
LAVIAADRAL TAAYEADDPA YRASAAWNMG QVLSNRGHTE DAVDMCRQAI ADLQRTADDD 
PVRLAALGGL HLLLSIQYAR LRDERRTLDV LDRADELAAR TGETEHHFIF FGPTNTAIHR 
AAATLELSRP GEAARIAERV DVGRSPSIER RHSHLTHLAR AYASKRDDYA AIHMLQRAHR 
ESPEESSLNL LMRGTVRELL TRETATSRDE LRGLAELVGV V