Gene Snas_4807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_4807
Symbol
ID	8886014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	5102842
End bp	5104002
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	73%
IMG OID
Product	putative transcriptional regulator, PucR family
Protein accession	YP_003513541
Protein GI	291302263
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.525155
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATTGG CCGCCACGAT TCAGAAGATC GAACGCGCCG CCAGCGCCCT GGCCACCCAG 
AGCGTGGCCC GCATGGACGC CGAACTGCCG TGGTTTCGCG AGCTGCCCGC CGAACAGCGG 
GCCATGGTCA CGCTGGTCGC GCAGGCCGGG GTCGGCTCCT TCGTGGAATG GCTGCGCGGC 
GACGGTGAGG CACCGGCCGT CGGCGACGAG GTCTTCGACG GCGCCCCGCG CGAGCTGGCC 
CGCCTGATCC GGTTGCAGCA CACCGTGGCG CTCATCAAGG TCACCATCGA CGTCGTCGAG 
GAGCAGGTGC CGCACCTGGC CGCGCCCGGG GAGGAGGAGG CGCTGCACAT CGCGGTGCTG 
AAGTTCTCCC GCGAGGTCGC CTTCGGTGCC GCGCGGGTGT ACGCCCGCAC CGCCGAGACC 
CGGGGCGCCT GGGACGCCCG GTTGCAGGCG ATGCTGGTCG ACGGGCTGCT GCGCGGCGAC 
GACGGCGACG AGATCGCCGG ACGCGCCGCC GCGCTGGGCT GGGGCGACTC GTCCCCGGTC 
GCGGTGGTGG TGGGCCGCTC CCCCGGCGGC GAGGCCGCCG TCATCCTGCA CGCGGTGCAC 
CGGGCCACCC GCCGGATGGG CATCGACGTG GTCGCCGGTG TGCACGGCGA ACGGCTGATC 
CTGGTGCTGG GCGGAAGCAC CGAACCCGAG GAGGTCGCGG GCAAACTCGT CGGGCAGTTT 
GGCGAGGGCC CGATCGTGGT CGGACCGGCG ACGCCGAGCC TGGCCGAGGC GGGCGCCTCG 
GCGCGGGCGG CGCTGTCGGG ACACCGGGCG GCACCGGCCT GGCCGGGCGC GCCGCGTCCG 
GTCTCGGCGC ATCAACTGCT GGCCGAGCGG GCGCTGGCCG GGGACAACGA GGCCCGACGG 
ATCCTGCGCA TCGACGTCTA CAACGCCCTG GAACGCGCCG GTGGTTCGCT GCTGAGCACC 
GTGGACACCT TCATCGCCAC CGGCGGCGTC CTGGAGGGCA CCGCGCGGGC GGTGTTCGTG 
CACCCCAACA CGATTCGCTA CCGGATGCGC CGGGTCGCCG AAGTGACGGG TTTCTCCCCG 
TTTGTCCCCC ATGACGCTTT CACTCTGCAC GTGGCCTTGA CCATAGGTCG CCTGGATCCC 
ACCAGTGACG TCATACGTTA G

Protein sequence

MELAATIQKI ERAASALATQ SVARMDAELP WFRELPAEQR AMVTLVAQAG VGSFVEWLRG 
DGEAPAVGDE VFDGAPRELA RLIRLQHTVA LIKVTIDVVE EQVPHLAAPG EEEALHIAVL 
KFSREVAFGA ARVYARTAET RGAWDARLQA MLVDGLLRGD DGDEIAGRAA ALGWGDSSPV 
AVVVGRSPGG EAAVILHAVH RATRRMGIDV VAGVHGERLI LVLGGSTEPE EVAGKLVGQF 
GEGPIVVGPA TPSLAEAGAS ARAALSGHRA APAWPGAPRP VSAHQLLAER ALAGDNEARR 
ILRIDVYNAL ERAGGSLLST VDTFIATGGV LEGTARAVFV HPNTIRYRMR RVAEVTGFSP 
FVPHDAFTLH VALTIGRLDP TSDVIR