Gene Slin_5462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5462
Symbol
ID	8729229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	6645439
End bp	6646539
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	54%
IMG OID
Product	hypothetical protein
Protein accession	YP_003390227
Protein GI	284040297
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.674322
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAGCA GCCGTACCCG TATCATCGCT GTCGTTTTTT TCCTTTTCCT TTTCCTGCCG 
ACGGTCGATC AGCTACTTGG CCTGTCGTCC CGATTCAGCA GTACCGAGAA CAGGAAACTG 
AATGGGATGC CCGCGCTGAA CTTTCCGCAC CTTCGCAGCT TTGTCAAACA GTTTGACCAT 
TATTACAAAG AGAATTTTGG CTGGCGGAAT GCGCTGTTTT ATGTCTACAG CCGCTGGAAG 
TTTAATATTC TGGGAGAATC GCCCCTACCC GAAAAGGTAG TTGTGGGTAA GAATGGCTGG 
CTGTATCTGG GCAATAGCTA CAACAAAGTC ATTGACCAGC ACCGGGGTCT GCAACCGCTT 
TCGCTGGATT CGGCCCGTCG GATTGCCAGC CATCTGATGC AGCGCCAGCA GGAACTGGCC 
CGTCAGGGCG TCCAACTCTA CGTTCTGGTA GCTCCCGATT CGCACACCAT TTACCCCGAG 
TACCTTCCCG ACCATTTACA ACAAAGCACC GCCCCATCGC GACTGGATGT TCTCAAGCAG 
GCCATTAACC AGACTAACCT TCGCTTTGTC GATATTCGGG ATACGCTTCG GGCCGCCAAA 
CGAGACCATG TGGTGTATTA CCAGACCGAT ACGCACTGGA ACGAATACGG AACCCTGATC 
GGCAGTGCAT TCCTACTAAA CCGGATTCGG CAGGAGCAGC CCGCTATTCC TCCCGTTCGG 
CTGTCGGATT ACCACATAGA AAAGCAATTG GGCGGGGCCG GTGACCTGAC CACCATGCTG 
ACGCTTCAGG ATGAGCAGCG GGATACGATC TATTATTACA TAAAACCCAT CCCCAGCCGG 
GCCGCACGGC AAACGGCCCA GATTCCGAAC GAAGAGACGG GGTACCCAGC CACCCGGTTT 
TCAGGACCGG GCGCGGGTCG GCTGTTAGTC ATCGGCGATT CATTCAGTCA CGGGCTTATG 
AACTACCTGC CCGGCTATTT TCGTGAATCC TATTTTATCC GGGGCCGCTA CCTGGACCCT 
GCGGTTATAA AAGCGGAGAA GCCCACCGTT GTCGTCATTG AAGTCGTAGA ACGCAACATT 
AACCAGTTAG CCACTTTTTA G

Protein sequence

MNSSRTRIIA VVFFLFLFLP TVDQLLGLSS RFSSTENRKL NGMPALNFPH LRSFVKQFDH 
YYKENFGWRN ALFYVYSRWK FNILGESPLP EKVVVGKNGW LYLGNSYNKV IDQHRGLQPL 
SLDSARRIAS HLMQRQQELA RQGVQLYVLV APDSHTIYPE YLPDHLQQST APSRLDVLKQ 
AINQTNLRFV DIRDTLRAAK RDHVVYYQTD THWNEYGTLI GSAFLLNRIR QEQPAIPPVR 
LSDYHIEKQL GGAGDLTTML TLQDEQRDTI YYYIKPIPSR AARQTAQIPN EETGYPATRF 
SGPGAGRLLV IGDSFSHGLM NYLPGYFRES YFIRGRYLDP AVIKAEKPTV VVIEVVERNI 
NQLATF