Gene Slin_4453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4453
Symbol
ID	8728213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	5394371
End bp	5395600
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	50%
IMG OID
Product	hypothetical protein
Protein accession	YP_003389233
Protein GI	284039303
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACACA CAAGATTATT AATAGTCGGT TTTGTTTGGT TAGGTTGTCT GGCTGTTCAA 
GCGCAAATAA AACCCCAGAC GGGTTTTTGG CGTGGCGTCT TTACTATGGC CGGCGGGCAT 
ACGGCTCCGT TTAACCTTGA GCTGACGGGC AAAACGGCTT ACCTGCTCAA TGGTACCGAA 
CGCTTTGAAC TGAAAAACGT GACGCAGCGG GGCGATTCGC TGATTATTCC GGTCGATGTG 
TACAATACGG TACTGGCGGC AAAGGTTGAG GATGCCAAAA CGTTGTCGGG CGTATTTAAA 
CACCTGGAAT CTCCCACAAC GGGTGTCCCT TTCCGGATGG AGCACGGAAA ACGGTATCGG 
TTCGTTGAAA ATCAGGCTGC TCCTGTGGTG AGCATGCATG GCAAATGGGA CATCCTTATC 
GACGAAAAAA TCAAACTCAT CGGTGTATTC GAACAACACG GCAGCAAATT GACCGGTACT 
TTTCTGAGTA CGGGTGGAGA CATGCGTTAC TACGAAGGCT CAGTGCAGAA CGATGAATTT 
GCCTTGTCTG CGTTTGACGG CTCCAACCCG CAGCTGTTTA TCGGTAAGAT CAGTGGTAAC 
GAATTAAGTG GCAGCTTCGT CAATAGCCGA CAGGTACGTT CATTGAAAGG CACCCGGAAT 
GCACAGGCAG CTTTGCCCGA CGCTTACAGC CTGACAAAAA TGAGAGAAGG GATTCCTTTC 
ACGTTTACCT TTCCCGATGG GTTTACGGGC AAACTCGTAT CACTAAGCGA CCCTAAGTAC 
AAGAATAAAG TGGTCATCGT GACCACGATG GGAAGCTGGT GCCATAACTG CATGGACGAA 
GCGGCTTTTC TAGCGCCCTG GTACAAGGCT AACAAAGATC GGGGTGTCGA AATAATTGGT 
CTGGCTTTTG AAGTGAAAAA CGATCCGGTT TTCGCCAAAG CCCGTCTCGA AACGGTTAAA 
AAACGGTACC AGATTGGCTA TGATATGCTC TTCGCGGGTA TTGCCGACGA AAAACACGCG 
TCAGCCGTAT TACCCGCCCT GAGCGAGATG TCAGTGTACC CTACCACGAT TTATGTAAGA 
CGTAATGGCG AAGTGGCCAA AGTGCATACC GGCTACTCTG GGCCAGCCAC CGGACAGTAT 
TACGAAGCGT TTATCAAGGA GTTCAATGCC GAGATGGACC AGTTGCTCAA TGAGCCGATT 
TCAGACAGGG CACCGGGTAA GGCTAACTAA

Protein sequence

MRHTRLLIVG FVWLGCLAVQ AQIKPQTGFW RGVFTMAGGH TAPFNLELTG KTAYLLNGTE 
RFELKNVTQR GDSLIIPVDV YNTVLAAKVE DAKTLSGVFK HLESPTTGVP FRMEHGKRYR 
FVENQAAPVV SMHGKWDILI DEKIKLIGVF EQHGSKLTGT FLSTGGDMRY YEGSVQNDEF 
ALSAFDGSNP QLFIGKISGN ELSGSFVNSR QVRSLKGTRN AQAALPDAYS LTKMREGIPF 
TFTFPDGFTG KLVSLSDPKY KNKVVIVTTM GSWCHNCMDE AAFLAPWYKA NKDRGVEIIG 
LAFEVKNDPV FAKARLETVK KRYQIGYDML FAGIADEKHA SAVLPALSEM SVYPTTIYVR 
RNGEVAKVHT GYSGPATGQY YEAFIKEFNA EMDQLLNEPI SDRAPGKAN