Gene Snas_5647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5647
Symbol
ID	8886862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	6003332
End bp	6004633
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	69%
IMG OID
Product	histidine kinase
Protein accession	YP_003514370
Protein GI	291303092
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.559873
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.146404
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCATA CGTCGATCCC CATCTCGCAG ACGACCGGTG CCCGTATCGG TCGCCGGTTC 
AAGCAGCTGG GCCTGGTGTT TCCGCTGCTG GGGCTGAGCA TCGCCGGGCT GGTGATGTTC 
GTCCTGTTCG TCGTGGGGAT GCCGTTGGTC TTCCTGACCG TGGGCATCCC GCTGGTGGTC 
GGCGCGGTGG GGGCGACCCG GGGGTTGTGC AACGCCGAGC GGTTCATCTA CCGGGTGGGC 
TTCGGCGTCG AGATCGACCG ACCGTACCGG CCGTGGCCGA AGGGCAACGT CGCCAAGGTG 
CTGCTGGAGT TGGCCAAGGA CGCGAGCACG TGGCGGAACT TCGGCTGGCA GGCGGTGAAC 
TTCACCCTCG GCTTCATCGT GTTCGTCACC TACATCGCGC TGTTGGGCGG CGCGCTGATG 
GCGCTGATCC AGCCGTTCCT GTGGCTGGGG CTGCCGGACG TCTTCGACAC CTATTACGGC 
TTCATCAGTT ACGACAGCTT CGCCCTCGCG ATGACCTACG GGGTCATCCT GGGCGGCATG 
AACTTCGTCG CCTGGTGGGT GGGCGGGGAC GCCATGCTCA ACGGCTACGC CCGGCTGGCC 
GGGGTCATGA TGCGCGCCAA CAAGTCCCAG AAACTTCAGC GCCGGGTGGT CGAGCTGACC 
GAGTCCCGCG CCGACACCGT CGACTCCTCG GCGGCCGAAC TGCGCCGCAT CGAACGCGAC 
CTGCACGACG GTGCCCAGGC CCGGCTGGTG GCGTTGGGCA TGAGCCTCGG CATGGCCGAG 
GAGATCCTGA CCTCCGATCC GCAGGCGGCG GCGAAACTGC TGGCCGAGGC CCGCGAGAAC 
TCCGGCGCGG CGCTGTCGGA GATCCGCGAT CTGGTGCGCG GCATCCACCC GCCGGTGCTG 
GCCGACCGGG GCCTGGGCGG TGCGGTGGAG GCGCTGGCGC TGGCCCACCC GCTGCCGGTG 
ACGGTGGAGA CGAACCTGCC GGGGCGTCCG CCGGAGCCGG TGGAGTCGGC GGCGTACTTC 
GCGGTCGCCG AGGCGCTGAC GAACGTCGCC AAGTACGCGC AGGCGACCGA GGTGTTCGTC 
CGGATCGGTT ACTTCGGGAC CCGGCTGGGG ATCACGGTGC GCGACAACGG CAGGGGCGGC 
GCGACGGTGA CGCCGGGCGG CGGCCTGGAC GGGGTGACGC GCAGGCTGGC GGCCTTCGAC 
GGTGTGGTGA CGATTCGCAG TGAGCCGGGC GGGCCGACGA TCGTGGCCTA CGAGATCCCG 
TGCGAGCTGA CGGTACGTCC AAGTTTAACG ATGGATGAGT AG

Protein sequence

MSHTSIPISQ TTGARIGRRF KQLGLVFPLL GLSIAGLVMF VLFVVGMPLV FLTVGIPLVV 
GAVGATRGLC NAERFIYRVG FGVEIDRPYR PWPKGNVAKV LLELAKDAST WRNFGWQAVN 
FTLGFIVFVT YIALLGGALM ALIQPFLWLG LPDVFDTYYG FISYDSFALA MTYGVILGGM 
NFVAWWVGGD AMLNGYARLA GVMMRANKSQ KLQRRVVELT ESRADTVDSS AAELRRIERD 
LHDGAQARLV ALGMSLGMAE EILTSDPQAA AKLLAEAREN SGAALSEIRD LVRGIHPPVL 
ADRGLGGAVE ALALAHPLPV TVETNLPGRP PEPVESAAYF AVAEALTNVA KYAQATEVFV 
RIGYFGTRLG ITVRDNGRGG ATVTPGGGLD GVTRRLAAFD GVVTIRSEPG GPTIVAYEIP 
CELTVRPSLT MDE