Gene Sare_5101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5101
Symbol
ID	5704069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5775454
End bp	5776767
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	70%
IMG OID	641274493
Product	GntR family transcriptional regulator
Protein accession	YP_001539834
Protein GI	159040581
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000307944
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGACCGGTA CGACACTCGA CGACTACACC GACCGCTACG CCCGACGGGT CCGGGGCATG 
ACCGCCTCGG AGATCCGGGC GCTCTTCGCG GTGGCCAACA GACCAGAGGT GGTCTCGCTC 
GCCGGTGGCG CGCCGTACAT CGCGGCTCTC CCCCTGGACG CGGTCGGCGA GATGCTCGGC 
CGGCTCGGCA CCGACCACGG TGTCACCACC CTCCAGTACG GCATCGGCCA GGGCACCCTG 
GAACTACGTG AGCGGATCTG CGAGGTGATG GCGCTCTCGG GCATCGACGC CGCCTGCGGA 
GCCTCCCCCG ACGACGTCGT CGTCACCGTC GGCGGCCAGC AGGCGCTGGA CCTCGTCGCG 
CGACTCTTTC TCGACCCGGG CGACGTGGTA CTCGCCGAGG GACCGACCTA TGTCGGGGCA 
CTCGGCGTGT TCCAGGCCGC CCAGGCACAG GTCGTACACG TCCCGATGGA CAGCGACGGG 
CTGGTCCCGG AGGCGCTGGA GGCGGCGATC GCCGAGCAGG CACGTGCCGG GCGTCGGATC 
AAGTTCCTCT ACACCATCCC CACCTACCAG AACCCGACCG GTGTGACGCT GACGGAGCAG 
CGACGCGAAC AGGTGCTCGA CATCTGTGAA CGCGCCGGTC TGCTGGTGGT GGAGGACGAC 
CCGTACGGCC AGCTCGGCTT CGAGGGCGAT GCCCCGGCCC CGCTGCGTGC CCGCCGCCGG 
GACGGCGTCT TCTACCTGGG GACGTTCTCG AAGACCTTCG CGCCGGGGCT CCGGGTCGGA 
TGGATCCTCG CCCCACACGC GGTGCGGGAC AAGCTCGTCA TCGCCAGTGA GGCGCAGATC 
CTCTGCCCCA GCGGCTACGC TCAGGCGGCC GTGTCCACCT ACCTCGGCAC CATGCCGTGG 
CGCGAACAGC TCAAGGTCTA CCAGGAGATC TACCGGGAAC GGCGGGACGC GTTACTCACC 
GCCATGGCGG ACCTGATGCC GGACGGCACG ACCTGGACCC GGCCCGGAGG CGGCCTCTTC 
GTCTGGGCCA CCCTGCCGGA CGGCCTGGAC TCGAAGGCGA TGATGCCCCG CGCCATCGCC 
GCCCGGGTGG CATACGTGCC CGGCACCGGC TTCTACGCCG ACGGCACCGG TAACGGCGCC 
ATGCGACTCA ACTTCTCCTT CCCGCCGCCG GATCGGATCC GGGAGGGTGT TCGGCGGTTG 
GCCAGCGTCA TGGAGCAGGA CATCGCCATG CGCAGGGTCT TTGGCACCGT TGGCCATCCC 
GGCTCGCGGC GGGGGCAGGC CGGTTCGGAC ACACCAGGAC CGGACTTGGC ATGA

Protein sequence

MTGTTLDDYT DRYARRVRGM TASEIRALFA VANRPEVVSL AGGAPYIAAL PLDAVGEMLG 
RLGTDHGVTT LQYGIGQGTL ELRERICEVM ALSGIDAACG ASPDDVVVTV GGQQALDLVA 
RLFLDPGDVV LAEGPTYVGA LGVFQAAQAQ VVHVPMDSDG LVPEALEAAI AEQARAGRRI 
KFLYTIPTYQ NPTGVTLTEQ RREQVLDICE RAGLLVVEDD PYGQLGFEGD APAPLRARRR 
DGVFYLGTFS KTFAPGLRVG WILAPHAVRD KLVIASEAQI LCPSGYAQAA VSTYLGTMPW 
REQLKVYQEI YRERRDALLT AMADLMPDGT TWTRPGGGLF VWATLPDGLD SKAMMPRAIA 
ARVAYVPGTG FYADGTGNGA MRLNFSFPPP DRIREGVRRL ASVMEQDIAM RRVFGTVGHP 
GSRRGQAGSD TPGPDLA