Gene Rxyl_3052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_3052
Symbol
ID	4114852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	3059844
End bp	3061223
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	62%
IMG OID	638037820
Product	permease for cytosine/purines, uracil, thiamine, allantoin
Protein accession	YP_645772
Protein GI	108805835
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1457] Purine-cytosine permease and related proteins
TIGRFAM ID	[TIGR00800] NCS1 nucleoside transporter family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.700557
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGCAG AGACCCACCA CATAGACGTC ATTCCGGAGG ATGAGCGGCA CGGGAGGGCG 
CGCGATCTGT TTTTCGTGTG GTTTGCGGCG AACTTCAACA TCGGCAACGC AGTCTTCGGG 
GCGGTGGCGG TTTTTCTGGG TAACGATCCG TTGTGGGCAA TGCTCGCGGT GATAGTGGGA 
AACCTGCTTG GCGGGGTGTT CATGGCGTAC CACTCGGCGC AAGGCCCACA GCTCGGGGTC 
CCACAGCTCA TCCAGAGCCG CGGCCAGTTC GGTTACTATG GGGCGCTCAT GCCCGTGGGG 
CTGGCGGTGT TGTTGTACGG AGGCTTCTTT GTGCTCACGG CGGTCATAGC AGGGCAGGCG 
CTCACGGCGG TATTTCCGGG TCTGAGCCTG GATCTCGCGA TAGTCATCGG GGCTACGCTC 
AGCCTCGTGC TCGCGCTCTT CGGCTACAAC GCCATCCACA GGGCAGCGCA GATCGGCACC 
TGGCCGCTCG CCATCCCGGT CGTGATGCTC ACCGTCGCCA CGCTGGGAGA GGGCACGCCA 
GAACTCACGC CGTCCGGGTT CCAGATCGGA CCCTTCGCCC TCGCCGTGGC GCTCTCGGCG 
ACCTTCCAGC TCACCTACGC GCCCTACGTC TCCGACTACT CGCGTTACCT CCCGAGCGAT 
ACGAAGGTTT CTGCCACGTT CTGGTGGACC TTCCTCGGCG TCACCACGAG CGTCATATGG 
ACCCAGCTCA TCGGGGTTCT CCTCGCTTTC CAGTTTGAGA ACCTTACCAC CTTCGACGCG 
GCCAAGAAGC TCCTTGGGAC GAACGTCCTG ACCGCGGTGA TACTGCTTAT CAGCGGGGCC 
GCCATCGCGG GCAACAACGC GCTCAATCTT TATGGCGGGA TGCTCAACTT GGTGCCGAGG 
GGGTTCAAGA TGCGGGCGCT GCTCATACTG CCCACCTTCG TCGTCGGCAC CGCGCTCGCC 
ATCCTCGCCT CCAGAGACTT CATCGCCACC CTCACCAACT TCCTCAGCCT CCTGCAGCTG 
ACCTTCGTGC CGTGGGGCGC GATCAATCTC ACCGACTTCT ACCTCGTCAA AAAGGGGCGC 
TACGATGTCG GCGCCTTCTT CGAGCCCCGC GGCCCCTACT ACAGGGACGA GGCCTCCTGG 
ACTTTCCACG GCATCGCCTG GAAGGCCATA CTGTGTTACT TGGTTGGGAT AATCGTGCAG 
GTGCCGTTCC TGAACAACGC TTGGTTCAAG GGCTGGCTGA CAGACCCTCT CGGCGGCGGC 
GATTTCTCCT TCATCTTCGG CCTCGTCGTG CCCGCGGTCC TCTACTACGT GCTGATGCGC 
CCGCGAAGAA CAAACGTACG GAACGCCACA GAATTAACCG AAGCGGCGGG AGGACCCTAG

Protein sequence

MAAETHHIDV IPEDERHGRA RDLFFVWFAA NFNIGNAVFG AVAVFLGNDP LWAMLAVIVG 
NLLGGVFMAY HSAQGPQLGV PQLIQSRGQF GYYGALMPVG LAVLLYGGFF VLTAVIAGQA 
LTAVFPGLSL DLAIVIGATL SLVLALFGYN AIHRAAQIGT WPLAIPVVML TVATLGEGTP 
ELTPSGFQIG PFALAVALSA TFQLTYAPYV SDYSRYLPSD TKVSATFWWT FLGVTTSVIW 
TQLIGVLLAF QFENLTTFDA AKKLLGTNVL TAVILLISGA AIAGNNALNL YGGMLNLVPR 
GFKMRALLIL PTFVVGTALA ILASRDFIAT LTNFLSLLQL TFVPWGAINL TDFYLVKKGR 
YDVGAFFEPR GPYYRDEASW TFHGIAWKAI LCYLVGIIVQ VPFLNNAWFK GWLTDPLGGG 
DFSFIFGLVV PAVLYYVLMR PRRTNVRNAT ELTEAAGGP