Gene Slin_4677 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4677
Symbol
ID	8728441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	5698046
End bp	5699224
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	50%
IMG OID
Product	Curlin associated repeat protein
Protein accession	YP_003389454
Protein GI	284039524
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.119342
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.286934
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAG TATTACTCAC ATGGTCTGCG CTGCTGATCA TGGCTGCTTC TTACGCTCAA 
TCAAATACGT CCACACTCAG CCAGACCGGC ACCGACAACA AGGCCATGCT TACCCAAACG 
GGAGAAGGGC AGCAGGTAAT TGCGGTACAG GAAGGCAATA ACAACCAACT GACAACTTCC 
CAAACCAGCA CATACGCCCA GGAAATTAAC ATCAGTCAAA CCGGTGCCTC CAATAAAGCC 
GTTGCTACCC AGGATGAGGG TTCCGGCCCG GGAACGTTCA TTCAGATTTT ACAGAATGGC 
ACTAATAATG ACGCGCTGGC CAATCAGTCG GACTACCTGA CCTATGGCAG TGAAGCGTCT 
ATAAATCAGT CAGGGCAGAA TAACAAGGCA ACGATCAGTC AGCTTACGGC TGTTGGGAGT 
TCGGCGGGTA TTGAGCAGAC GGGAGTAGGG GCAGGCAACA CCGCTACCAT TACCCAGACT 
AACCTGAGCT ACCAGGATGC CGCCGAAATT CGTCAGAGTG GGCAGAATCA AACGGCTACT 
ATTTTGCAGA ACGGAACTAT TTACCTGATT GGTGGTAACC AAGCCTATAT TAATCAGACA 
AGTACGTTTG CCCAGACCGC CCAGATTACT CAGGAAGGGG ATCAGAACCT GGCCGAAATC 
TATCAGGAAA ATGGAGCTGG TCCGGATAAT GTGGCCACAA CATTCCAGTC GGGTTATGGC 
AATGTCAGTT ACATTGATCA GTCTAACTTT GCGACAATCA ATAGCACGGC GGTCACGTCG 
CAGGTCGGCA ATTTCAACAA GGCTACTATC GAGCAGTTTG CGGCTCTCAA CGGACAGGCG 
GTTATCAACC AAACGGGTGA TGAGAACCAG GCTTACATTG GACAGGGTCA GGCCGGACAA 
AATCTGAGTT ACAATAACAA CGCCCAGATT ACCCAGTCGG GTGATTTTAA CGTTGCGGGC 
GTCATTCAGA CCGGCGAAGG CAACCAGGCT GTTTTTCAGC AAATTGGTAG TGGTAACGCC 
ATCCTCAATC TGACATCTAC GAATTTTGTC CTTCAGCAGG GTAACAACAA CTCCCTAACC 
GTTACCCAGA CCGGCATGGA CAATCTGTTG CAGATTCAGC AGACAGGTAA TGGCAACATT 
GGCATCATCA ACCAAAATTC AGGTGCCATA TTGCCTTAG

Protein sequence

MKKVLLTWSA LLIMAASYAQ SNTSTLSQTG TDNKAMLTQT GEGQQVIAVQ EGNNNQLTTS 
QTSTYAQEIN ISQTGASNKA VATQDEGSGP GTFIQILQNG TNNDALANQS DYLTYGSEAS 
INQSGQNNKA TISQLTAVGS SAGIEQTGVG AGNTATITQT NLSYQDAAEI RQSGQNQTAT 
ILQNGTIYLI GGNQAYINQT STFAQTAQIT QEGDQNLAEI YQENGAGPDN VATTFQSGYG 
NVSYIDQSNF ATINSTAVTS QVGNFNKATI EQFAALNGQA VINQTGDENQ AYIGQGQAGQ 
NLSYNNNAQI TQSGDFNVAG VIQTGEGNQA VFQQIGSGNA ILNLTSTNFV LQQGNNNSLT 
VTQTGMDNLL QIQQTGNGNI GIINQNSGAI LP