Gene Snas_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_3039
Symbol
ID	8884238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	3205134
End bp	3206264
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	72%
IMG OID
Product	histidine kinase
Protein accession	YP_003511803
Protein GI	291300525
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0758324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACAGCC GGGACGACTT CGCCAGCAAG AGCCGTAGCG TCGGCCTCAT CATGATCACG 
GCCCTGTCGG TCGTGTTCGT GCTCAACATG TTCTTCGGCG ACGAACGACC CCGCCTGGGG 
CTGACCGGTA CCGACCTGGC GGTCACCGTC GCGACCCTGA TCGCCTTCGC CTGCTTCGGT 
TTCGGCACCT ACCTGGCGCC GTCCCGGCGA CAGGTGGCGG TGGCCCTGTA CCTCCTCGCG 
GTCGCCGCGA CACTGTGGTT GACCGTGCTC GCGCCCGACC GCCCCGGCGA GCTCATGCTG 
TTCGTCATCG CGGGCGCGGC CGCCGCCCGG CTCCCGCTGC GGCACTCGGC CGTCGTCATG 
ACCGCGCTGG TGCTGGGCTT CGCCGCGACG GTGCTGTCGC GCACGGACGA CCTCGGGCAA 
CTGTGGTCCC TGGTGGGCGT CCTGGGCATG TACGCCGGCA TCACCGCCGC CCGCAACCGC 
AGGCGCACCC AGCACATCGA GCAGCAGAAC CTGGTGCTCG CCGAACGGGC CCGCATCGCC 
CGCGAGATCC ACGACATCCT GGCGCACTCG CTGTCGGCCC AGCTGGTCCA CCTCGAAGGC 
GCCCGGCTGC TGGCCAACGC CGGACGCACC GACGAGGCCG TCGACCGCAT CGAACGCGCC 
CGCGAACTGG CACGCGGCGG CCTCACCGAG ACCCGCCGCG CCCTGGACAC CCTGCGCGGC 
GAGACCCTCA AGGTCGACGA GGCACTGCGC GAACTGGCCG ACGAACACCG CGAGGCCACC 
TCGGGCACCT GCACCGTCAC CGTGACCGGC GAACCCCGCG ACCTCGCCGC CGAGGCCGGG 
CTGGCGCTGG TGCGCACCGC CCAGGAGGCG CTGACCAACG TCCGCAAACA CGCCAACGGC 
GCTGACGTCA CCATCGAACT GCGCTACCGC GACGACGACT GCGAACTCGA GGTCGTCGAC 
ACCGGCGGCC GGGGCGTGGC ACTGGCCGAG ACCGGATCCG GCTACGGTCT GGTCGGGATG 
CGCGAGCGCG CCGAACTGAT CGGTGGCACG CTGCGAGCCG GACCCCGCGA CGGCGGCTTC 
GCCGTCGAGT TGCGGGTGCC GTCGTCAGGA AAGGAAGTGG GCGCGCGGTG A

Protein sequence

MNSRDDFASK SRSVGLIMIT ALSVVFVLNM FFGDERPRLG LTGTDLAVTV ATLIAFACFG 
FGTYLAPSRR QVAVALYLLA VAATLWLTVL APDRPGELML FVIAGAAAAR LPLRHSAVVM 
TALVLGFAAT VLSRTDDLGQ LWSLVGVLGM YAGITAARNR RRTQHIEQQN LVLAERARIA 
REIHDILAHS LSAQLVHLEG ARLLANAGRT DEAVDRIERA RELARGGLTE TRRALDTLRG 
ETLKVDEALR ELADEHREAT SGTCTVTVTG EPRDLAAEAG LALVRTAQEA LTNVRKHANG 
ADVTIELRYR DDDCELEVVD TGGRGVALAE TGSGYGLVGM RERAELIGGT LRAGPRDGGF 
AVELRVPSSG KEVGAR