Gene Slin_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_1994
Symbol
ID	8725732
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	2407295
End bp	2408458
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	48%
IMG OID
Product	histidine kinase
Protein accession	YP_003386838
Protein GI	284036908
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.376445
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.00440814
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACGAAG TTATCGAGTT TTTTCAGCAA CTCGCAAATG TTAACGATTG GCCTCCCCGC 
TGGTATTGTG GTCGATGGAC AGACTTTCAC GGCTGGCTTT ATATAGTATC TGACTTAACC 
ATCTGGCTGG CCTACATGGC TATCCCACTC ATTTTAATCC GATTTATACT AGTCAAAAAG 
GGCGTACCCC TATCCGGTGT TTTTGTACTG TTTGGTGCCT TCATTCTCCT CTGCGGCCTT 
ACCCACTTGC TCGATGCAAT CATGTTCTGG TGGCCCGCCT ATCGAATCAA TGCCCTGATC 
CGTTTTTGTA CCGCCATGGT ATCCATTGCA ACCGTTCTGG CTCTGATCCG GTACTTCGAT 
GAAGCCGTTG GGCTGCGTAC ATCAAAAGAG TATGACCGCG AGTTGTCATT TCGTCAGCAG 
GCTATGCAGG AGCTTACCCG CTCTAATGAA GAACTTCAGC AGTTTGCCTA CATTGCATCG 
CATGATTTAC AGTCACCGCT CAAAACAATC GTTAACTACC TTACACTACT GGAAAGTAAA 
CACGGAGAGA AACTGGATAC GGACGCTGTC CGATTAATCA ATGTGTCGAC AGCGGCTGCC 
GAACGGATGC GGGTGCTGAT CAATGACCTG CTCGACTTTT CCCGCGTTGG TACCGATATC 
GATTTTCAGA CGGTGGACCT CAACGAGGTT CTGGCCGAAA TCCTGGAGGA GCACCAAACC 
GAAATACGGT CGACCGGGGC TTCGGTTGAT GTGGGCCCCC TCCCTACAAT CAGAGCCCAC 
CGAACCGATT TGAAACAGGT ATTCCAGAAT CTTGTTACCA ACGGACTTAA GTATCGACGG 
GCAGACGTTG TTCCCCATAT TCGAATACGG GCCACCGACG AAGGAAGTCA ATACCGGTTT 
ACGGTCAGTG ATAACGGGAT TGGCATCGAT TCAAAATACT ATGATCGGGT ATTCCAGATT 
TTTCAGCGGC TGCACGGTCG GAATGAATAC CCCGGAACGG GCATTGGTTT GGCTACCTGT 
AAGAAAGTAA TCGACATTTA TGGCGGACAG ATCGGACTCA ACAGTACGGT AGGTGTGGGC 
TCAACATTTT ATGTAGTAAT TCCAAAAGTT ATCAAGACAA GTCAGCATTA TGCCCAGACC 
CATTCACTGT ATCCTGTTAA TTGA

Protein sequence

MNEVIEFFQQ LANVNDWPPR WYCGRWTDFH GWLYIVSDLT IWLAYMAIPL ILIRFILVKK 
GVPLSGVFVL FGAFILLCGL THLLDAIMFW WPAYRINALI RFCTAMVSIA TVLALIRYFD 
EAVGLRTSKE YDRELSFRQQ AMQELTRSNE ELQQFAYIAS HDLQSPLKTI VNYLTLLESK 
HGEKLDTDAV RLINVSTAAA ERMRVLINDL LDFSRVGTDI DFQTVDLNEV LAEILEEHQT 
EIRSTGASVD VGPLPTIRAH RTDLKQVFQN LVTNGLKYRR ADVVPHIRIR ATDEGSQYRF 
TVSDNGIGID SKYYDRVFQI FQRLHGRNEY PGTGIGLATC KKVIDIYGGQ IGLNSTVGVG 
STFYVVIPKV IKTSQHYAQT HSLYPVN