Gene Snas_4899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_4899
Symbol
ID	8886106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	5203607
End bp	5205358
Gene Length	1752 bp
Protein Length	583 aa
Translation table	11
GC content	72%
IMG OID
Product	histidine kinase
Protein accession	YP_003513633
Protein GI	291302355
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.597043
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCGGA TGACTGATCG GGGCGGGGCG GGTTTCAGTG CCCGGGCCCG GATTCTGGCC 
TGGATGCTGT TGTTGGTCAC CGGGGCGCTG TTCGTGTCGG TGTTCGCCAC CTATGAGGTG 
TTGTTGAGTC GGCTGGACGT GCGGCTGGAG GACGAGCTGG GGCATGAGGT CGACAAGTTC 
CGGGGTTTCA CGAAGGGCGG CTTGAACCCG GCGACCGGTG AGGCCTATAC CGGGGTGGAG 
CAGGTGCTGG AGGTGTACCT GTACCGGAGT CTGCCGGAGG AGCACGAGAC CTATGTGGCG 
GTCGTGGACG GGGTTCCGTA CAAGCGCAGT GCCAAGGAGC CGCCGGCGCG CATCGACCAG 
AATCGTGAGC TGATCAAGCG GATCACCGAT GTGGACGCTC CGGCGACGGG GTGGATCGAG 
ACCTCGGCCG GGGAGGCGCG GTACGCGGCG ATCCCGGTGA CGGTGGACGG GCGCGACGAG 
GTGGGGCACC TGGTGGTGGC GGAGTTCCGG GACGTGGAGG CCGCCGACAT CAACGAGGCG 
ATGGTGGTGC TGATCCTGGT GGGGCTGGCG GCGATCGGGC TGGCCGGGAT CGGGGGCTGG 
CTGGCGGCGG GGCGGATCCT GGCGCCGGTG CGGCTGGTGC GCAACACCGC CGAGCGGATC 
AGTGAGACCG ATCTGTCCGA ACGGATCCCG GTGCGGGGGC GCGATGACGT GGCGGCGTTG 
ACGCAGACGT TCAACACGAT GCTGGACCGG CTGGAGGAGT CGTTCGCGGC GCAGCGGGAG 
TTCGTGGACG ACGCGGGACA TGAGCTGCGC ACCCCGATCA CGGTGGTGCG CGGGCACCTG 
GAGCTGTTGG GGCAGGGCAT CGACGACGCC GACGAGCGGG CCGAGACGCT GCGGCTGGTG 
ATGGACGAAC TGGACCGGAT GCGGCGCATC GTCGACGATC TGCTGGTGCT GGCGAAGTCG 
GGCACCCCGG ACTTCCTGCG TCCGGCCGAT GTGGACCTGG CGGAGCTGAC GGTCGAGGTG 
GTGGCGAAGG TGCGCACGCT CGGCGATCGG CGGTTCGTCA TCGACGAGAT GGCCGAGACC 
GTGATCCGCT CCGACGAGCA GCGGCTCACC CAGGCGCTGA TGCAGCTGGT GGCCAACGCG 
GTCCGGCACA CCGGGCCCGG CGACGAGATC GGCGTGGGTT CGTCGGTGAC GGAGCAGCGG 
GTGCGGCTGT GGGTGCGCGA CAGCGGGCCC GGGGTCGCGG CGGCCGACCG GGAGCGGATC 
TTCGAACGCT TCGTGACCGG CCCGGCCCGC GACCGGGAGG GCAACGGCAG CACCGGTTCC 
GGCGCCGGGC TGGGCCTGGC GATCGTGCGG GCCATCGCCG AGGCGCACGG CGGCCGGGTA 
ACCGTGACCG ACGCTGGAGA CGGCGCGGCG TCCGACCGGC GGCGACTGGC CGAAGCGATG 
GCGAGCGCCG GAGGTGCCGG GGCAGCGAGG CTGTCGCGCG ATGTCTCGGC TGGGGCCGGT 
GGCACGGCCA AGACGCCCGT GACGAGCGCC GGGCGCGGCA CGGACGAGTT CGAGGACGCC 
GAGCCGGGGG GTGCCGCGGC GTCGGGCGAG CCGGCGACGG CCGCCGGAGG AGCCGAGGCG 
ACCGGGCCGG GAATGGCCGG GTCCGGCGGG ATCGCGGCCT CGGCCGCTCG CGTCGGCGGA 
CGCGAACCGG CGGCCCGGGC CGCGAGCGTG GCGGGCGGCG CGGTGTTCAC CATCGAGGTG 
CCGAGGCGAT GA

Protein sequence

MTRMTDRGGA GFSARARILA WMLLLVTGAL FVSVFATYEV LLSRLDVRLE DELGHEVDKF 
RGFTKGGLNP ATGEAYTGVE QVLEVYLYRS LPEEHETYVA VVDGVPYKRS AKEPPARIDQ 
NRELIKRITD VDAPATGWIE TSAGEARYAA IPVTVDGRDE VGHLVVAEFR DVEAADINEA 
MVVLILVGLA AIGLAGIGGW LAAGRILAPV RLVRNTAERI SETDLSERIP VRGRDDVAAL 
TQTFNTMLDR LEESFAAQRE FVDDAGHELR TPITVVRGHL ELLGQGIDDA DERAETLRLV 
MDELDRMRRI VDDLLVLAKS GTPDFLRPAD VDLAELTVEV VAKVRTLGDR RFVIDEMAET 
VIRSDEQRLT QALMQLVANA VRHTGPGDEI GVGSSVTEQR VRLWVRDSGP GVAAADRERI 
FERFVTGPAR DREGNGSTGS GAGLGLAIVR AIAEAHGGRV TVTDAGDGAA SDRRRLAEAM 
ASAGGAGAAR LSRDVSAGAG GTAKTPVTSA GRGTDEFEDA EPGGAAASGE PATAAGGAEA 
TGPGMAGSGG IAASAARVGG REPAARAASV AGGAVFTIEV PRR