Gene Slin_4554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4554
Symbol
ID	8728318
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	5520859
End bp	5522136
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	52%
IMG OID
Product	histidine kinase
Protein accession	YP_003389333
Protein GI	284039403
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00930403
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGC TCAGCCAGAC AGCCCGCTAT TTACTCAGCA CGGCTTTTGC GATTGCGCTG 
GTGGGATCTG TAGGCTTTTA CACGCTTATC CACCGAACAA TCCGGTATGA AGTCGATGAA 
ATTCTAACGG CCCAGGTAAA CCAGACAGCC CAAAAGCTAC GCCATCAGCC GCTTTCGACC 
CTAACCGACT GGGATAACAA CCCGCGCATC GACCGGGTGA ATACACCCAT AAGGCCCACC 
TTCACCGACA TAACCGTACC CGACTCGCTG AATAATAATG AACCGATTCC AATTCGGCAG 
CTCCAGCAAA CGGTGCTCAT ACAGGGGCAG TTGTATCTGG TCACCATTCA GCAGCCGTAC 
TACGAATTCA ATGAGCTGTC GCGCGAAATA TCGGCGGGGG TTATCATTGG CTTTTTACTA 
CTGATGGGCT TGTCCGTCGC TATCGGTGTT GGTTTATCGA GTCGTTTGTG GTATCCGTTT 
TACGCCACCA TCAACCAGCT TAGCACCGTC CGGCTCGATA CAGGCAGCGA ACCGGTATTC 
CCGGAAAGCA ATATCCGGGA GTTTAGTCTC CTTAGCCGGT CGCTGAGGGA ACTGACGCAG 
AAATTACGAC GCCAGTTTTC CCTCCAGAAG CAATTCGCCG AGAACGCGTC GCACGAATTA 
CAAACCCCGT TGGCGGTTGC ATCGGCTGAA CTTGATTTCC TGCTTCAGTC CGACCACCTG 
ACGGAAAATG ATTACGCCCA CCTGCAACGG GCCACCGACG CGCTGGGGCG GTTGAGCCAG 
CTCAATCGTT CATTGTTGTT ACTCACACAG GTAGAAAACA ACCAGTTTGC CAACGACGAA 
TCTGTTGACA TGAGCGAGTT GCTGACACAA TGTGCGGATG AATACGAGCC TTTTTTTCAA 
CACCGACACT TGGTGGTTAA ACGAGCGATT GCCCCCCAAG TCATTCTGCG TATGAACCGG 
CAACTAGCGC GCGTCCTACT CTCAAATCTC CTGAAGAACG CGGTTCGGCA TAGCGGTGGC 
GGAGTTGCAA GAAAAGAAAG CACTGTCCGT TTAGAATTAA CGACCAACGC GCTAACCATC 
ACAAATACAG GCGAGCCATT ACCCTTTCCC GAGCACCAGT TGTTCTATCG GTTCGTCAAA 
AACCCGGCCC GGCCCGACTC GATGGGATTG GGGCTGGCAC TTGTCAAGCA AATCTGTGAG 
CGCTATGCCC TGCCAATAAC TTACGTGTAT AACGGAGAAA CCTGGGAGCA CTCATTTCGG 
ATAGAATTCC CGACCTGA

Protein sequence

MSLLSQTARY LLSTAFAIAL VGSVGFYTLI HRTIRYEVDE ILTAQVNQTA QKLRHQPLST 
LTDWDNNPRI DRVNTPIRPT FTDITVPDSL NNNEPIPIRQ LQQTVLIQGQ LYLVTIQQPY 
YEFNELSREI SAGVIIGFLL LMGLSVAIGV GLSSRLWYPF YATINQLSTV RLDTGSEPVF 
PESNIREFSL LSRSLRELTQ KLRRQFSLQK QFAENASHEL QTPLAVASAE LDFLLQSDHL 
TENDYAHLQR ATDALGRLSQ LNRSLLLLTQ VENNQFANDE SVDMSELLTQ CADEYEPFFQ 
HRHLVVKRAI APQVILRMNR QLARVLLSNL LKNAVRHSGG GVARKESTVR LELTTNALTI 
TNTGEPLPFP EHQLFYRFVK NPARPDSMGL GLALVKQICE RYALPITYVY NGETWEHSFR 
IEFPT