Gene Slin_3123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_3123
Symbol
ID	8726876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	3792267
End bp	3793367
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	52%
IMG OID
Product	protein of unknown function DUF34
Protein accession	YP_003387933
Protein GI	284038003
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACAAA TCCGTCAGCT CGCGGCCCAT ATTGAAGCGC TGGCCCCCCT CGCCTATCAG 
GAATCGTACG ACAACGTGGG GCTACTCGTA GGCGACCCCA CCACCGATAT AAAAGGCGTT 
TTGGTAACGC TCGATGTAAC CGAAGCAGTT GTCGACGAAG CTATTGCCAA AGGGTGCAAC 
GTCATTGTAG CGCATCACCC GGTTGTGTTT AAGGGCTTGA AAAAGCTGAA CGGAAAAACG 
TATGTGGAAC GTACCGTTAT CAAAGCCATC AGGAATGACA TAGCCATTTA TGCGGCTCAC 
ACCAATCTGG ATAACGTGGC GGGGGGCGTT AACTTTAAAA TCGCGGAGAA ACTAAAACTG 
ACGAACGTAC AGATTCTGGC ACCTAAAACG CAGGTTCTGA GCAAGCTGGT TACATTCGTC 
CCTATAAACG ACACCCAGCG GGTACTGGAT GCACTCTATG CAGCCGGAGC GGGCCAGATC 
GGTGATTACA AAAACTGTAG TTTCCGGGTT AGCGGTACCG GTACATTCCA GCCGGGCGAG 
AATGCCCAGC CCGTCATTGG CGATATAGGC GAGTATCATG AAGAGCCCGA AAATCGGATT 
GAGGTTATCA TTCCGACCCA TCAACAGAGA CAGGTATTGA CCGCCCTCCG GCAGGTACAT 
CGCTATGACG AGGTGGCCTA TTACCTGACG CCGTTGGATA ATCAGCATCA GGAGGTCGGT 
TCAGGAGCCG TGGGCGATTT GCCGGAGCCG CTGACAGGAA CGGCCTGGCT GTCTTATTTA 
AAAGAACACA TGAGTCTGAA CCTGATCCGG TACACGGCCC TCCCCGACCG GCCGATCCGC 
CGAATCGCCG TTTGCGGGGG TGTTGGCAGC TTTTTACTAC CCGACGCCAT CCGGGCGGGC 
GCTGATGTGT TTGTGACGGC GGATTACAAG TATCACGAAT TCTTTGATGC CGAAGGACGC 
ATAAGTATCT GCGATATTGG GCATTACGAA AGTGAAGTCT ATACGAAAGA CTTGATTTGC 
GGGCATTTGG CAAAAAAATT CACTACTTTT GCGGTAATTT TATCAGAAAC GGATACGAAT 
CCGGTTCGGT ACTTCATATA G

Protein sequence

MPQIRQLAAH IEALAPLAYQ ESYDNVGLLV GDPTTDIKGV LVTLDVTEAV VDEAIAKGCN 
VIVAHHPVVF KGLKKLNGKT YVERTVIKAI RNDIAIYAAH TNLDNVAGGV NFKIAEKLKL 
TNVQILAPKT QVLSKLVTFV PINDTQRVLD ALYAAGAGQI GDYKNCSFRV SGTGTFQPGE 
NAQPVIGDIG EYHEEPENRI EVIIPTHQQR QVLTALRQVH RYDEVAYYLT PLDNQHQEVG 
SGAVGDLPEP LTGTAWLSYL KEHMSLNLIR YTALPDRPIR RIAVCGGVGS FLLPDAIRAG 
ADVFVTADYK YHEFFDAEGR ISICDIGHYE SEVYTKDLIC GHLAKKFTTF AVILSETDTN 
PVRYFI