Gene Slin_0224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_0224
Symbol
ID	8723952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	297408
End bp	298718
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	56%
IMG OID
Product	Xanthine/uracil/vitamin C permease
Protein accession	YP_003385088
Protein GI	284035158
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.274555
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.678538
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCAACTA CGTTTACTTC CCGTCGAACC GAAGTATTAG CCGGTATCTC TTCCTTTCTG 
GCCACCATGT ACATCATTGT GGTCAACCCG GCCATATTGA GTCAGGCCGA TTTACCCTTT 
AGCGGGGTCC TGACGGCTAC CGTATTGCTG TCGTTCTTTT GCAGCCTGAT GATGGGCCTA 
TACGCCCGCA ACCCCATTGT GGTGGCTCCG GGTATGGGGA TGAATGCGTT TTTCACCTTC 
ACAACCGTCA AAGGCATGGG CATCCGCCCC GAAATCGCTC TGGGGGCGGT ATTCTGGTCG 
GGTGTTCTGT TTCTACTGCT ATCTATTTTT AACGTGCGGT CGGCCATTGT ACGGGCTATT 
CCGCAACCAC TACGCTATGC GGTTTCGGCC GGAATCGGGC TTTTTGTTAC GCTCATTGGC 
TTCGAGAACG CCAGGTTCAT TGTGGCCAAT CCGGCTACGC TGGTGAGCAT CGCCCATTTC 
AACGACCCTA TCGTTCTCAC GTTTGTCTTT GGCCTGCTGC TCATGAGCGT GCTGGTCGTG 
CGTGATGTGC CGGGCGGCAT TATCGTCGGC ATTATCCTAA CAACGCTGGT CGCCTGGCCC 
ATCGGGCGGT ACTGGGGTGA TGCCTCGGCC ATTAATTTCG GGCAGAAAAC GCTGGTCAAT 
TTTCAGGGCG TTCTGGCCGC GCCCGACTTC TCGCTTCTGG GCAAGCTGGA CCTGATGGGT 
TCGCTATCCT GGTCACTGTG GCCGGTTATT TTTGCCTTTG CGTTCACCGA TTTGTTCGAC 
AGCCTGTCGA CCTTCGTAGG TGTTGCCGAA GCAGGTGGCT TGCAGGACGA AGACGGCCAA 
CCGCGTAACC TGAACCGCTC GCTGATGACC GACGCCGTGG CTACTACGCT GGCGGGGATA 
TTCGGCACCA GTCCAGGCAC GGCCTATATC GAATCGGCGG TGGGGATTGC GCAAGGGGGA 
CGAACGGGCC TCACGGCAGT AGTAGCCGGT TGCTGTTTTT TGCCGTTTCT GTTTCTGTCG 
CCCCTATTGT CGATCATACC AGCTATTGCC ACGGCTCCGG CCCTGGTGCT GGTGGGAGCC 
TTCATGATGA AACCCATTAC GCGCATCGAC TGGAGTCAAC TCGACGATGC GCTCCCCGCC 
TTTCTGGCGC TGGTTCTGAT TCCGTTCAGT TACTCCATCA CGCAGGGGCT CATATGGGGA 
TTCCTTTCCT GGACCGTTAT CAAAGTTGCC GTTGGCAAGA GCCGCGAGGT ATCGACGGGT 
CTCTGGATTG TCGATGTCTT TTGCGTACTG GCGTTGACGA GTGGTCATTA G

Protein sequence

MSTTFTSRRT EVLAGISSFL ATMYIIVVNP AILSQADLPF SGVLTATVLL SFFCSLMMGL 
YARNPIVVAP GMGMNAFFTF TTVKGMGIRP EIALGAVFWS GVLFLLLSIF NVRSAIVRAI 
PQPLRYAVSA GIGLFVTLIG FENARFIVAN PATLVSIAHF NDPIVLTFVF GLLLMSVLVV 
RDVPGGIIVG IILTTLVAWP IGRYWGDASA INFGQKTLVN FQGVLAAPDF SLLGKLDLMG 
SLSWSLWPVI FAFAFTDLFD SLSTFVGVAE AGGLQDEDGQ PRNLNRSLMT DAVATTLAGI 
FGTSPGTAYI ESAVGIAQGG RTGLTAVVAG CCFLPFLFLS PLLSIIPAIA TAPALVLVGA 
FMMKPITRID WSQLDDALPA FLALVLIPFS YSITQGLIWG FLSWTVIKVA VGKSREVSTG 
LWIVDVFCVL ALTSGH