Gene Slin_5890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5890
Symbol
ID	8729668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	7132157
End bp	7133518
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	53%
IMG OID
Product	Fmu (Sun) domain protein
Protein accession	YP_003390652
Protein GI	284040722
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.133324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.00389453
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAGACGC AGTTGGGAGC AGAGTTTGCC AAATTTGAGT CCGCACTGGT GGAGCCAACC 
CCGGTGAGTA TCCGCATTAA TGCCCGAAAA TTGGGTGGGG CCGCTTATGA TCCCACCGAT 
CTGGTGCCTG TTCCCTGGTG TCCCGATGGC TATTACCTGC CCGAACGCCC CAGTTTCACG 
CTTGATCCGT TGTTTCAGGC TGGTGCTTAT TATGTGCAGG AGGCTTCGTC GATGTTGTTG 
CACGAAGCCC TCCGGCAAAC GGTCAATCTC GACCGGCCGC TAAGGGTACT AGACCTATGC 
GCGGCTCCGG GTGGGAAAAG TACGTTGCTG GCGTCGGCCC TGCACCCCGA TAGCCTATTG 
GTATGTAATG AAGTGATACG TAGCCGGGTG TCGGTCCTGC GCGAGAATCT GGATAAATGG 
GGTTACCCAA ATGTGGTGGT CAGCAACCAC GACCCGGAAG ACATGAGCAA GCTGACGGGT 
TTTTTCGATG TTGTGCTGGT CGATGCACCC TGCTCGGGCG AAGGCCTGTT TCGAAAAGAT 
CCCGACGCTA TGCAGGAGTG GTCGGAAGCG AGTGTTGATC TGTGCTCAGC CCGGCAGAAA 
CGGATTCTGG CCGCAGCTGC ACCTTTACTC GATAAAGACG GTATTCTGAT CTATAGCACC 
TGTACATATA ATGATAGAGA GAACGCCGAA AACGTTCGAT ATCTGACCGA AATCGGGTTT 
CGTAATAAGC CGCTTATTCT GCCATCGGAA TGGAATATTG TGGAGCGACA GGCGGGCGAT 
CCGGAAACGG GTGAGGCCGT CGGGTATCAA TGCTACCCGC AGCGGGTTCG GGGCGAAGGC 
TTTTTTATCA GTGCCTTTAA AAAAACGGGC TTTACGGCTC CGGTAAAACT CGATGCCCGA 
ACGTTTCGGA CCATTCGTGC CCTTCGACCC CGCGAAACGG CTTCAGCGGC CAAGTGGCTT 
CAGAATCCAG CCGATTTTTC GTTCTGGGAG AAACCCAATG GCGATGTGAT GGCCCTGCCT 
AAAGCACTCG AAAAAACGTA CCTATTTCTC GACAGTGCTT TAAAGAGTAA AGGCTTTGGG 
TTAGAGATGG GGCAGTTTAA AGGAACGGAC TTTGTACCCT CGCACGCGCT GGCGCTGAGT 
ACGGCGGTTA ACCAAGACCT GCCGGGGCTC GAATTGAGTA AGGAAGACGC CCTGCGCTAC 
TTTAAGAAAG AGAATCTAGT ATTTGATGAA CCCGTAAAAG GCTGGCTACT CGCCAAATAT 
AAAGGGGTAA ATCTGGGTTG GGTAAAAGGA GTAGGTACTC GCGTTAATAA CTATCTTCCG 
AAAGACTGGC GAATCAGAAT GGATATAAAG GAGTACGTAT GA

Protein sequence

MQTQLGAEFA KFESALVEPT PVSIRINARK LGGAAYDPTD LVPVPWCPDG YYLPERPSFT 
LDPLFQAGAY YVQEASSMLL HEALRQTVNL DRPLRVLDLC AAPGGKSTLL ASALHPDSLL 
VCNEVIRSRV SVLRENLDKW GYPNVVVSNH DPEDMSKLTG FFDVVLVDAP CSGEGLFRKD 
PDAMQEWSEA SVDLCSARQK RILAAAAPLL DKDGILIYST CTYNDRENAE NVRYLTEIGF 
RNKPLILPSE WNIVERQAGD PETGEAVGYQ CYPQRVRGEG FFISAFKKTG FTAPVKLDAR 
TFRTIRALRP RETASAAKWL QNPADFSFWE KPNGDVMALP KALEKTYLFL DSALKSKGFG 
LEMGQFKGTD FVPSHALALS TAVNQDLPGL ELSKEDALRY FKKENLVFDE PVKGWLLAKY 
KGVNLGWVKG VGTRVNNYLP KDWRIRMDIK EYV