Gene Slin_4080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4080
Symbol
ID	8727838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	4909640
End bp	4910845
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	51%
IMG OID
Product	glycosyl transferase family 2
Protein accession	YP_003388866
Protein GI	284038936
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.606735
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.10978
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTACTG CCCTGCTGCT ATTCTGGCTA TCTATAGTCG GTATTCAGCT TATCTATATC 
TTCTTCGTTT ACACCAAAAC GGCTTTTTAT CGCCATCCAG ACCGAAACTA TGCCGTTTTA 
TCCTACAATT CTGCCGACTA TTATTCCGAA TCAGACGATC AGCAGGGCGT AACGGTCATC 
GTCTGTGCCC GTAATGAGTT GGCCAACCTT AAGGAGCTGC TGCCCCTGCT GAACAACCAG 
GACTATCCTA CGTTCGAGAT ACTCGTCATG GACGACCGCT CGACCGATGG CACCTACGCG 
TATCTGGAAA ACGACATCCC TGAACTAAGC CGGGTTCGTG CTATCCGTAT CGATAAGGAG 
CACCAGCACG TAACGCCCAA AAAGTACGCC CTCACCATTG CCATCAAAAA AGCCCGCTAC 
CCTACTGTTC TGCTTACAGA TGCAGACTGT CGCCCGGCTT CGCTGAACTG GCTTACCGAA 
ATGACCGAGC CATTGATTTT CGGTTCCAAA GACATTACGA TTGGGTTTTC GCCTTATGAA 
TATTACCCGG GGTTGCTCAA CCTGCTGATC CGCTCAGAAA CCCTGTTTAC GGCTATTCAG 
TATTTTTCAC TGGCTCTGTC GGGGCGGCCC TATATGGGCG TTGGCCGGAA TATGGCCTAC 
CGGACCGACC TGTTTTTTGC GAATAAAGGC TTTTATACGC ACATGAATGT GGTTGGTGGC 
GACGATGATC TGTTCATCAA CGAAGTCGCT ACCCGCTCTA ACACGTTCGT TTGTCTGGCA 
CCCGATACAT TTGTATGGTC GAAACCCAAG ACAACCTGGG CCGAATGGCG GCAGCAGAAA 
CGACGCCACC TTAACGTGGG CAAGTACTAC AAAACAGGGA ATAAAGTGCG GCTGGGGCTG 
CTCACCGGCT CGCATGTGCT AAGTTGGGCT ATGGCCCTGG TAGTGGGTTT GCTGGTAGTC 
GTTCATGCGC TTCACTGGTA TTCGTTTTCC AGCGACGAGT GGTTACTTTT GCTGGTCAGT 
ACAGGGGCTT TTATTCTCCG GCAACTTGCC TTCTGGGTGA TTGTCGGACG AATCAGCCAC 
CGACTGGCCC ACACCGTTCA CTGGTCCTTC ATACCGTTTA TGGACCTGCT GATGGCCGTT 
TATTACGGAC TGGCTGGTCT GAAAACGCTG TTTAACCGTC GCAAAAAACA AATTTACTGG 
CGATAG

Protein sequence

MITALLLFWL SIVGIQLIYI FFVYTKTAFY RHPDRNYAVL SYNSADYYSE SDDQQGVTVI 
VCARNELANL KELLPLLNNQ DYPTFEILVM DDRSTDGTYA YLENDIPELS RVRAIRIDKE 
HQHVTPKKYA LTIAIKKARY PTVLLTDADC RPASLNWLTE MTEPLIFGSK DITIGFSPYE 
YYPGLLNLLI RSETLFTAIQ YFSLALSGRP YMGVGRNMAY RTDLFFANKG FYTHMNVVGG 
DDDLFINEVA TRSNTFVCLA PDTFVWSKPK TTWAEWRQQK RRHLNVGKYY KTGNKVRLGL 
LTGSHVLSWA MALVVGLLVV VHALHWYSFS SDEWLLLLVS TGAFILRQLA FWVIVGRISH 
RLAHTVHWSF IPFMDLLMAV YYGLAGLKTL FNRRKKQIYW R