Gene Sare_1653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1653
Symbol
ID	5703554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1903227
End bp	1904420
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	70%
IMG OID	641271159
Product	XRE family transcriptional regulator
Protein accession	YP_001536534
Protein GI	159037281
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0453749
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0870716
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGG AAGCAGGCGA GGGTTTTCCC CCGTCTACAG ACACCCCCGC CGACCTCGGC 
GCTCACCTGC GAGCCGCCCG TGAGGCCGCC GGACACAGCC TCGCCGGTAT GGCCGCGCTC 
ACCCACTTCA GCAAGCCCTA CCTCAGCCTT GTCGAGACGG GCCGCCGTCA GGCCACTCCC 
GACATCGTTG AACGCTACGA ACATGCCCTC GGTGTACCGA TCGGCACCCC AGCCGACCCG 
GTCCGCCGAA CCCACGAATG GCTCCTGGAC AGCCCACCCG CCACCGGCTG CCTACGCGCC 
GGCCGCCGCA TCGGCGCAAA CCTGATCCGA ACGCTGGAAG CCCGGGTGAT CGACCTCCGC 
CACCTGGACG ACACGGTCGG CAGCCGCACC CTGCTTCCCG TCATCCGCGC CGAACTCGAC 
CACGCCGAAC ACCTCGCCCA CACCGCCTCC TACACCGACA CCTCCGGTAG ACGGCTGTAC 
ACCGTGATCG GTGAACTGGC CCAACTCGCC GGCTGGGTCG CCAGCGACGC CGGCCACTAC 
TCCGACGCCC AACGCCTATA CCTATCCGGC GTCACCGCCG CCGACGCAGC CTGCGACCGG 
GCGCTGGGCG CGCAACTGCT GTCGAGCCTC GCCTACCAGA TCACCAACAT CGGCAAACGC 
GACGACGCCC TGCTCATCGC CCGCTCCGCC GTCACCGGCG CCCCGCACGC CAGCCCGCTC 
GTGCGGGCGC TGCTGCTGGA ACGCCTCGCC TGGGCCGCCG CCCGCCTCCG CGACACCGAT 
ACCACCCGCC GCGCCCTTGA CGCCGTCAAC GACGCCTACG ACCAACACTG CGACGGTATC 
GCCGAGCCCG AATGGGTGTA CTGGCTCAAC CGGACGGAGG TCGACGTCAT GGCCGCCCGC 
TGCCTCATCG AACTCGGCAC CCCAGCCGCC GCCGAACCCC TGCTCACCCG AGCGCTCGCC 
GGCTACAACC ACGACCACGC CCGCGAAGTC GCCCTCTACC AAACCTGGCT TGCCGAAGGC 
CACGCCAAAA CCGGCAACCT CGACGCCGCC CGCGCCGTCC TGCACCGCAT CGACACCACC 
GCCATCGACG CCGGCTCCAC CCGCCTGCAC CGCCGCATCA CCGCCGTCGA CCGCCTCATC 
AACCGCCGCG CACAGAAGAA GCCCGCCAAC AGCACCAGAC GACCGACCGA GTAG

Protein sequence

MTMEAGEGFP PSTDTPADLG AHLRAAREAA GHSLAGMAAL THFSKPYLSL VETGRRQATP 
DIVERYEHAL GVPIGTPADP VRRTHEWLLD SPPATGCLRA GRRIGANLIR TLEARVIDLR 
HLDDTVGSRT LLPVIRAELD HAEHLAHTAS YTDTSGRRLY TVIGELAQLA GWVASDAGHY 
SDAQRLYLSG VTAADAACDR ALGAQLLSSL AYQITNIGKR DDALLIARSA VTGAPHASPL 
VRALLLERLA WAAARLRDTD TTRRALDAVN DAYDQHCDGI AEPEWVYWLN RTEVDVMAAR 
CLIELGTPAA AEPLLTRALA GYNHDHAREV ALYQTWLAEG HAKTGNLDAA RAVLHRIDTT 
AIDAGSTRLH RRITAVDRLI NRRAQKKPAN STRRPTE