Gene Slin_1991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_1991
Symbol
ID	8725729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	2403930
End bp	2405033
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	52%
IMG OID
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_003386835
Protein GI	284036905
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.310287
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0147414
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTATT TTCCGATAAA ACCATATTCT TTCGCAAAGG TAACCAACGC AATGGCCCAC 
TCACTATTCC GGGTACATAT CATTCGTCAG GTACTCCTGC TGATTTTTAT AGCCATCGTC 
TTCATTCGCT GCGGCAATAA CACGACCGAT GAGGCTGCTC AGTTTTTCCT GAAGGGGAAT 
GTTCAGTTGC AGAAACGTGA GTACAAAGAA GCAATCCGGT TCTACTCAGA AGCCATCGCC 
AAAAAATCAG ATTTTGCGGA CGCCTACAAT AACCGGGGGT TAGCCAAGTT TCGGGACGAC 
GACCGGGAGG GGGCGTTGGC CGACTATACC CGGGCTGTTG AACTGGACCC TGATTTTGGT 
ACGGCGTACT TTAATCGGGC CGAGGTTCTC CTTGAAACCG GTGATGCGGC CGGTAGTGTG 
TCGGACTTGA TGCGGATCAA TAAACAATAC CAGGATTCTA CCTTTTATCA AACGCGTTTG 
GGCGACGTCT ATGTACGACT GGGGAAGCAG GCCGAGGCTC AGGCAGCTTA TGACCGCGCT 
TTGCAACTCA ACCCCGATAA TGTGGAGGCT CTAACCAATC GGGGGGCTTT GTTGTATAGC 
CAGAAGGCCT ATGACCAGGC CGGTGAGGAC ATACAGCGGG CTCTTCGGCT CAATCCAAAG 
CAAGATGCTG CCTTGAACAA CCAGAGTTTA CTGCTCGCGC GTGTCGGTAA TTTTGCCGAA 
GCGCTCGTCT ATGTAGAACG TGCACTGGCT TTACAACCCC GACAGCCGTA TTACCTGAAC 
AACAAAGCGT ATTTATTGCT GAAACTAAAC CGGGCTTCCG AAGCACTTCC GGTGGTGCAG 
GAGTCTCTGC AACGCGATGA CCGGAATGCC TGGGCTCATC AAACCCTCGG GCTGTATTAC 
CTGAGTCAGA AACAGGCGGA CAAGGCACTT ACCGAATTTC GGCAGACCGA AAAACTGGAT 
GCGTCCGTAG ATCAGGTCTA TTATTATATC GGTCTAGCGG AGCAGGCCCT CAACCAGCAG 
CAGGCCGCCT GCGAAGCCTG GCGACTGGGC GAATTGGCCG GGGATGAACA GGCCAGAAAA 
ATCCGGGCTC AGCAATGTAA GTAG

Protein sequence

MNYFPIKPYS FAKVTNAMAH SLFRVHIIRQ VLLLIFIAIV FIRCGNNTTD EAAQFFLKGN 
VQLQKREYKE AIRFYSEAIA KKSDFADAYN NRGLAKFRDD DREGALADYT RAVELDPDFG 
TAYFNRAEVL LETGDAAGSV SDLMRINKQY QDSTFYQTRL GDVYVRLGKQ AEAQAAYDRA 
LQLNPDNVEA LTNRGALLYS QKAYDQAGED IQRALRLNPK QDAALNNQSL LLARVGNFAE 
ALVYVERALA LQPRQPYYLN NKAYLLLKLN RASEALPVVQ ESLQRDDRNA WAHQTLGLYY 
LSQKQADKAL TEFRQTEKLD ASVDQVYYYI GLAEQALNQQ QAACEAWRLG ELAGDEQARK 
IRAQQCK