Gene Slin_4921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4921
Symbol
ID	8728685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	5992331
End bp	5993710
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	48%
IMG OID
Product	exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase
Protein accession	YP_003389698
Protein GI	284039768
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.691187
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCATC GGTATTCTAT ACTATTTTTC CCGCTTCATG TAATCGTTGA TTTCCTGAGC 
CTGAATGCTG CCTTCGTCGG GGCTTACATT CTCAAATTCC AGGCTGTCGA ACCGGTTGCA 
GAGCCCCCTT ACGCGTCGCT TTGGGTAGTG TTTAACATAG TATGGTTGGT TGAAATTTTA 
CTGCTTAAGC CCTATATATT TCCTCGTCAA CTCTTTAAGG CAGACCACTT AGTAAAAAAA 
TTATTAATTC TGATGGCTAT TCATATAGCT GTCATATCCA TATACTGGGT AGCCGTAAAA 
GGGTACTACT TTTCACGTGA ACACTTACTG GTCACCTACC TGCTGTTTAC CAGTTTGGCG 
GTGGCTTTCC GGTTGGGTGG ACTGGTTTTT CTGAAAGAAT ATCGGGCCAG AGGGTACAAC 
AATCGTCGGT ACGTGATCGT CGGTTATGGT AAGTTGGCTG TGTCGATCCA GCGGTTTTAT 
GATGCGCATC CCGAAATGGG ATTTCGTTTC CTCGGTTATT TCGATGAGCC ATCTTCCGAA 
AATCAGCACC TGCTCAGGGG GAATTACGAC GATTTGCCTG CGCACATTCA GCAAGAGGGA 
ATAGATTGCG TGTACTGCTG TATGCCCTAC ATTGATAATG GTCGCTTGAA AAAGATTGTT 
GAAGAAGCCG AGTCGGTCGA TTACCAGGTA AAGTTGTTGG TTGACTTTCG GGGGTTTCTG 
GCGCGTGGCG CATCGGTCGA ATATCACGAT TTTCTGCCGG TATTGAATGT GTCCTCGCAG 
ATGCTGGCCG ATTTTCAGGT AAACACGCTC AAACGGTTAT TTGACATTCT GTTCTCGTTG 
GCTGCGCTGG GATTGGGGAT GCCCATGTTA ATTATTCTGG CTATTATAAC CAAGATTACG 
TCGTCTGGCC CCATTTTTTA CGCACAGGAG CGCATTGGGC AGGGAGGTAA GCCCTTCAAG 
ATTTATAAAT TCCGCAGCAT GTACGTCGAT TCGGAACGGT CGGGACCGGT GTTGTCGGGG 
GGCTTGCTCG ATGACCGGAT TACGCCCTGG GGACGGTTTA TGCGTAAAAC CCGGCTCGAT 
GAAATGCCTC AGTTTTACAA TGTGCTGATT GGAGACATGT CTGTGGTAGG CCCCCGTCCG 
GAACGACAGT ATTTTATTGA TCAGATTGTT GAAATCGCCC CCGAATACCG GTCTTTGCTG 
AAAGTAAAAC CGGGGATCAC GTCCATTGGG CAGATTAAAT ATGGCTATGC GGCCAACATT 
GATGAAATGG TGCAACGGTT GCGGTACGAC CTGCTGTATC CCCGACGTCG CTCTTTTTTA 
TTCGATATGT GGATCATTGC CCAAACGCTT CGGGTAATGG CCCAGGGCCG TGGCAAGTGA

Protein sequence

MRHRYSILFF PLHVIVDFLS LNAAFVGAYI LKFQAVEPVA EPPYASLWVV FNIVWLVEIL 
LLKPYIFPRQ LFKADHLVKK LLILMAIHIA VISIYWVAVK GYYFSREHLL VTYLLFTSLA 
VAFRLGGLVF LKEYRARGYN NRRYVIVGYG KLAVSIQRFY DAHPEMGFRF LGYFDEPSSE 
NQHLLRGNYD DLPAHIQQEG IDCVYCCMPY IDNGRLKKIV EEAESVDYQV KLLVDFRGFL 
ARGASVEYHD FLPVLNVSSQ MLADFQVNTL KRLFDILFSL AALGLGMPML IILAIITKIT 
SSGPIFYAQE RIGQGGKPFK IYKFRSMYVD SERSGPVLSG GLLDDRITPW GRFMRKTRLD 
EMPQFYNVLI GDMSVVGPRP ERQYFIDQIV EIAPEYRSLL KVKPGITSIG QIKYGYAANI 
DEMVQRLRYD LLYPRRRSFL FDMWIIAQTL RVMAQGRGK