Gene Snas_2843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_2843
Symbol
ID	8884042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	2991868
End bp	2993073
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	72%
IMG OID
Product	transcriptional regulator, XRE family
Protein accession	YP_003511611
Protein GI	291300333
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.397563
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGGAC CCGATCCCTC GACCGCCACC CAGCTCGACC TCATCGCGGG CCACTTCGGC 
AAACGCCTCA AGTACTGGCG GCTCACCCGG CAGCTGACCC AGGCCGAACT CGCCCGCGAC 
CTGAACCTGG ACGGCTCCTA CGTCTCCAAA CTCGAAAGCT CCCGCCGCCG CCCCAGCCTC 
GACATCGCCC GACAGTGCGA CGACCTGCTC GACACCGGCG GCGAACTGGC CGACCTGCTC 
ACCCTCGTGG CCACCGACCC GGGCCCACCG GTGGCCACGG TCGGGGCTCC GCTGCCCACC 
ATCTCCCCCA CCACCGCGCG CACCACGGCC CTGCCCGCCG CGGCCCCCGC CCACGCCACG 
GTCTCCCTCA ACCGCCTCGC CGAGGCCTAC GCCGAGGTCG CCGCCACCAT GGGCGGCCAC 
CACCTCGGCG AATCCGTCGA ACGCCAGGCC CAGGAGATCA TCGGCCGCCA CATCGGCAGC 
CCCGAGTCCC TCTCCGGCGG CCTGCTGCGC ACGGCGGCCC GCTTCGCCCG GCTGGCCGCC 
GCCATCCGCC TCGACTCCCT CGACGAGGCC GGAGCCCTCT ACTGGAACGA CTGCGCGGGC 
CGCTGGGCCC TCGACGGCGG CGACCCCGCC CTGTCGGCCG AGATGTGCGC CCGCACCGCC 
ATCGTCTACG CCCACCGCGA CAACGCCCCC ACCGCTCTCA CCCTCGCCAC CCGCGCCGAA 
CAACTGGCCC CCCACGCGCC CACCGCCACC GTCTGGTCCC TGCTCGCCCA GGCCCACGCC 
CACGCGGCCT CCGCCGAGCC CGACCAGACC ACCGGCGCAC TCGCCACCGC CCACAAGCTA 
CTGACCGAAC TCGACAGTCC ACTGATGGCA AACCCGTCCA CCTACAGCGA CAACCACCTC 
TGGCACTGGC ACGCCGGACT CTGCCACCTC ACCCTCGCCC GCCACGACAT CGACCGCACC 
ACCAACGCCA ACCGCGCCCT GGACCAACTC CGGCAAGCAC TGTCCGAAGT GTCCGTCTAC 
CACACCCGCG AACTGGCCCT CACCCGTCTG GCCCTGGCCC ACGCCTACCT CCACGCCGAC 
GACCCCGTCT CGGCCACCGC CGAACTCACC GAAGCCGCCA CCCTGGCCCG CGCCTGCACG 
TCACCCCGCC TCCACACCGA GCTCGCCCAG ACCACCACCA TCCTGGCCAC GACCACCCAT 
AAATAA

Protein sequence

MPGPDPSTAT QLDLIAGHFG KRLKYWRLTR QLTQAELARD LNLDGSYVSK LESSRRRPSL 
DIARQCDDLL DTGGELADLL TLVATDPGPP VATVGAPLPT ISPTTARTTA LPAAAPAHAT 
VSLNRLAEAY AEVAATMGGH HLGESVERQA QEIIGRHIGS PESLSGGLLR TAARFARLAA 
AIRLDSLDEA GALYWNDCAG RWALDGGDPA LSAEMCARTA IVYAHRDNAP TALTLATRAE 
QLAPHAPTAT VWSLLAQAHA HAASAEPDQT TGALATAHKL LTELDSPLMA NPSTYSDNHL 
WHWHAGLCHL TLARHDIDRT TNANRALDQL RQALSEVSVY HTRELALTRL ALAHAYLHAD 
DPVSATAELT EAATLARACT SPRLHTELAQ TTTILATTTH K