Gene Oter_4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Oter_4039
Symbol
ID	6204909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Opitutus terrae PB90-1
Kingdom	Bacteria
Replicon accession	NC_010571
Strand	+
Start bp	5238395
End bp	5239726
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	63%
IMG OID	641693707
Product	Na+ dependent nucleoside transporter
Protein accession	YP_001820913
Protein GI	182415847
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.17654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.283567
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTCA TCCTTCACCT CGGCCGCGGC TTTTTTGGCA TCGCGGTTTT TTTGGCGATC 
GCCGTCGCCC TGAGCGAAAA CCGCCGCGCC ATCAGCTGGC GGCTGATCGC CACCGGCGTC 
GCGCTGCAAT TCACCTTTGC CGCACTCGTG CTCTACTTCG CTCCGGCGCG CATCGTCATC 
GAGTGGATTG GCTCCCGCTT CGTCGACCTG CTCGGTTTCA CCAACGCCGG CGTCGAGATG 
CTGTTCGGCT CACTCGCCGA CAAGTCAAAG CACGGCGTGC TCTTCGCGAT TCAGGTTCTT 
CCCTCGATCA TCTTCTTCTC CGCTTTCTCG TCGCTGCTCT ACTACCTCGG CATCCTGCAA 
AAGATCGTGT TCGTGTTCGC CTGGGTGATG TCGAAGACGA TGCGGCTCTC CGGCGCGGAA 
ACCCTCAGCG CCTCGGCCAA CATTTTCCTC GGCCAAACCG AGGCGCCGTT CCTGATCAAG 
CCATACCTGC CGACGATGAC GCGCTCGGAG ATGCTCACCA TCATGACGGG CGGCATGGCG 
ACGATCGCGG GCGCCGTGAT GATCGCCTAC ATTGCATTCC TCGGCGGCGA TGATCCGCAG 
CAGCAGGTGC TGTTCGCCAC GCATCTCATC ACCGCGTCGG TGATCAACGC GCCCGCCGGG 
CTCATGCTTT CCAAAATCCT GCTGCCGCAG ACGGAGCCGG TGAGCACGGA CCTCAATGTC 
TCCAAGGAGC GGATCGGCTC GAACCTGGTT GACGCGGTCT GCGTCGGCAC GACCGACGGC 
CTCAAGCTCG CCGTCAACGT GGGCGCCATG TTGATCGCAT TCACCGCGCT GATCGCAATG 
CTCAACGCCT TGCTTGGCTG GTTCGGCAGC CCGCACGATC TGGTGATCGG CGGCGCCACG 
CTCGTGCACT ACCCGGGGCT GAACGCCTGG ATCCGGGAGG TGACCGACGG CGCGTTTCAA 
AGCTTCTCGC TCGAGTTGCT GTTCGGACTC GTCTACGCGC CGATTGCCTG GCTGCTCGGC 
ATAGACTTGG GTCATTTGCT TCAGTCGGGC GCGCTCCTCG GCACCCGCAC GGTGCTCAAC 
GAATTCATCT CGTTCTCGCA ACTCGCCGGC CTGAAGTCCT CCGGCGCGCT CACCGACGCG 
CGCACGATCA TCATTCTCAC CTACGCGATG TGCGGGTTCG CCAACATCGT CTCCATTGGC 
ATACAGATCG GCGGCATCGG TGCACTCGCG CCGAACCAGC GCTCCAACCT CGCGCAACTC 
GGCGTGAAGG CCATGATCGG CGGCACGCTC GCGTGCTACC TCTCCGCGTG CGTCGCCGGG 
ATCCTGACGT AG

Protein sequence

MDFILHLGRG FFGIAVFLAI AVALSENRRA ISWRLIATGV ALQFTFAALV LYFAPARIVI 
EWIGSRFVDL LGFTNAGVEM LFGSLADKSK HGVLFAIQVL PSIIFFSAFS SLLYYLGILQ 
KIVFVFAWVM SKTMRLSGAE TLSASANIFL GQTEAPFLIK PYLPTMTRSE MLTIMTGGMA 
TIAGAVMIAY IAFLGGDDPQ QQVLFATHLI TASVINAPAG LMLSKILLPQ TEPVSTDLNV 
SKERIGSNLV DAVCVGTTDG LKLAVNVGAM LIAFTALIAM LNALLGWFGS PHDLVIGGAT 
LVHYPGLNAW IREVTDGAFQ SFSLELLFGL VYAPIAWLLG IDLGHLLQSG ALLGTRTVLN 
EFISFSQLAG LKSSGALTDA RTIIILTYAM CGFANIVSIG IQIGGIGALA PNQRSNLAQL 
GVKAMIGGTL ACYLSACVAG ILT