Gene Snas_5143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5143
Symbol
ID	8886351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	5467749
End bp	5469239
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	68%
IMG OID
Product	histidine kinase
Protein accession	YP_003513871
Protein GI	291302593
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0703366
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.553184
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCG CCACCAGGTA CCACCAGTGG TGGGAGCGCA CACCGCTGCG GGTGCGGCTG 
GTCGCCGCCG TCCTGCTGCT GGTGACCGGT GCGCTGGTGC TCGTGAGTTT CGCGAACGTG 
ACCGCGTTGC AGAGCTACAT GACGACGCAG GTCGACGAGA ACCTGAACAA GCAGTTCAGC 
CGCGAGGGGC TGGACGAGGT GGTCGCGTCG AAGATGAACG CGGTGCCCCC GGACTCCAAG 
ACCACCAACT ACGTCTTCTA CTTCTCGTTC CGCAGCATCG AGGAGTTCAT GGGGCGGCAG 
GACCTCAACG CGCCCAAACT GGACTACGAC GACGTCGTGA AGCTGGGGGA GGGTTCGCAC 
ACCGTCACCG CGCAGGACGA CAAGAAGCGC TGGCGACTGC TGGTGCGCGA GGCCACGATC 
GAGACCACCA ACGAGAAGGG CTACGTCGTC GTCGGCACGC CCCTTGTGGA CGTCGACAAC 
ACCGTCGCCC GGCTACTGTG GATCGACCTG CTCGTAGGTG CCGGGGTGCT GGCGGCGCTG 
GCGGCCGTGG GGGTCGCGCT GGTGCGGGCC AGTCTCTACC CGCTCAAGGA GATGGAGCAC 
ACCGCCACCG CGATCGCGGG AGGTGATCTC AGCCAGCGGG TTCCCGAACG GGATCCCCGC 
ACCGAGGCCG GACGGCTCGG GCGGGTCTTC AACCAGATGC TGAGCCGCAT CGAGACGGCC 
TTGGAGGCGC GCGAGAAATC CGAGAAGCGG GCGCTGGAGT CCGAGGAACG GATGCGGCGT 
TTCGTCGCCG ACGCCAGCCA CGAACTGCGG ACTCCACTGA CGACGGTGCG GGGCTTCGCC 
GAGCTGTACC GGCAGCGCGC CGACGTCGAC CCCGTCGAGG TCGCCGGTCT GATGCGGCGC 
ATCGAGGACG AGGCCACCCG GATGGGCCTG CTGGTGGAGG ACCTGTTGCT GCTGGCCCGG 
CTGGACGCCG AGCGTCCGTT CCGGGACGCC CAGGTGGATC TGCTGACGAT CTCGGTGGAC 
ACCGTCACCG CCGCCGAGGT GACCGCGCAC GGTCGCCATA TCGAACTGTC CACACAGGGT 
GGTCCGTTCC TGGTGCGCGG TGACGAACTG AGCCTGCGGC AGGTGCTGTC CAATCTGGTC 
TCCAACGCGT TGCGCTACAC CCCGCCGGAG TCGCAGATCG AGGTGCGGCT GCGGTCCGAC 
GACACCCACG TCGAGCTGGA GGTCGTCGAC GACGGTCCCG GCATGACCGA GGAACAGGTG 
GAGCGGGTCT TCGAGCGGTT CTACCGGGCC GACAAGGCGC GCTCGCGCAA CGCCGGTGGC 
ACCGGACTGG GGCTGGCCAT CGTGGCGGCG CTGGTCGACG CCCACAACGG CGAGGTGTCC 
GTGTGGTCGA AACCTGGCGA GGGCGCGAAG TTCACCGTCC GGCTGGCGCT GGATCCAGAC 
GTGAGCGCCG AGCACGAGAT CCCCGACGCC GACAGCTCCG AGACCGTCTA G

Protein sequence

MSIATRYHQW WERTPLRVRL VAAVLLLVTG ALVLVSFANV TALQSYMTTQ VDENLNKQFS 
REGLDEVVAS KMNAVPPDSK TTNYVFYFSF RSIEEFMGRQ DLNAPKLDYD DVVKLGEGSH 
TVTAQDDKKR WRLLVREATI ETTNEKGYVV VGTPLVDVDN TVARLLWIDL LVGAGVLAAL 
AAVGVALVRA SLYPLKEMEH TATAIAGGDL SQRVPERDPR TEAGRLGRVF NQMLSRIETA 
LEAREKSEKR ALESEERMRR FVADASHELR TPLTTVRGFA ELYRQRADVD PVEVAGLMRR 
IEDEATRMGL LVEDLLLLAR LDAERPFRDA QVDLLTISVD TVTAAEVTAH GRHIELSTQG 
GPFLVRGDEL SLRQVLSNLV SNALRYTPPE SQIEVRLRSD DTHVELEVVD DGPGMTEEQV 
ERVFERFYRA DKARSRNAGG TGLGLAIVAA LVDAHNGEVS VWSKPGEGAK FTVRLALDPD 
VSAEHEIPDA DSSETV