Gene Rleg_5706 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5706
Symbol
ID	8016669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012853
Strand	-
Start bp	288049
End bp	289488
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	59%
IMG OID	644827857
Product	permease for cytosine/purines uracil thiamine allantoin
Protein accession	YP_002979057
Protein GI	241518429
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1457] Purine-cytosine permease and related proteins
TIGRFAM ID	[TIGR00800] NCS1 nucleoside transporter family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.829822
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.11286
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAAAAT CCGCCAATTT CACCTCAGAC GAACTGTCGG CATACGACGT CCATGGCATC 
GCGCCGGTTC CAGTGTCGCA CCGAACGTCA TCACCACTCG ACCAATTCTG GATCTGGGCC 
GGCGCGAACG TCGCTCCGAT CAACTGGGTT CTGGGAGCGC TCGGAATCCA GATGGGGCTT 
AGCCTCTGGG ATACGTTTCT CGTCATTGCG ATCGGCAATC TCGTGGGGGC AGCGCTTTTC 
GCCACATTCT GCCTCATGGG ATACCGAACC GGCGTTCCGC AGATGGTTCT CACTCGGCTC 
GCCTTCGGTC GCCGCGGCGC CTACCTGCCG ACTTTCGTGC AGCTTCTCAT GGCGATGGGC 
TGGGTGGCGA CGAACACCTG GATCGTACTC GATCTTTCGG TCGCTGCGCT CGATCGCATG 
GGAATTGGTG GTGGGATGGA GGTGAAATAT GCGATCGCCC TCGTCATCAT GGTGGTCCAG 
ATCGGGATAG CCGCCTGGGG CTTCAATGCG ATCAAGTATT TCGAGCGCTA CACGATGCCG 
GCGATCCTGC TGATCATGGT CGCGATGACA TTCATGGCGT CTTTTACGGT TGATATCCAA 
TGGTCCACCT CAACAGTCAC GGGTATCGCG CGGTGGTCCG CGATGAGCCA GCTGATGACG 
GCAATCGGTA TTGGCTGGGG CATATCCTGG CTGGTCTATG CGTCTGACTA CACGCGGTTT 
TCAAAACCAG GCTTGAAACC GTCCAGCGTC TTCAAGGCAA CGTTCCTGGG AATGTTCGTG 
CCCACGGTCT GGCTCGCCAC GCTCGGCGCG GCGATTGCTT CCGCCGGCGT CGGGTCCGAT 
CCGGCCCAGC TCATCATCGC GGCGTTTGGC GTGATGGCCT TGCCGGTCCT GCTCGTGCTG 
GTTCACGGGC CGATCGCAAC GAACATCGTC GTCATTTATT CCGCCGCGCT TTCAAGCCTT 
GCCATGGATA TCAACAAGCC CCGCTGGGTC GTTTCGCTCG CTTGCGGCGT TGCGGGATCG 
ATCATTCTCT ACGGCTTCAT GCAGTCGCAA GATTTCGCGC ATGCGTTCGA AACGTTCATG 
GTGACGATGG TCGTCTGGAT CAGCCCCTGG GCTGGCGTAA CCGCTGCCGA TTTCTTCATT 
ATGCGCCGCG GGTCGATCAA TGTCGACGAA TTGTACAAGC CGCACACGAC GAGCCGGCTC 
GGTGACGTCA ACTGGACCGG CGTCCTGTCA TTGCTGGTCG GCGTCTTCGC TGCCTATCTC 
TTCCAGATGA GCGTCGTCGA AGTCCTTCAA GGCCCCCTTG CCCTTGGCCT GGGCGGAATT 
GATCTTTCCT GGCTGGCCGG CTTTGTCGTC GCGTTCATGG CCTACATCGT TTCTCACAAG 
CTCCGAAGGA CCGCGGATGT CGGCGCGTCC GCACTGACGT TGCCTGTCCG TGGCGAATGA

Protein sequence

MSKSANFTSD ELSAYDVHGI APVPVSHRTS SPLDQFWIWA GANVAPINWV LGALGIQMGL 
SLWDTFLVIA IGNLVGAALF ATFCLMGYRT GVPQMVLTRL AFGRRGAYLP TFVQLLMAMG 
WVATNTWIVL DLSVAALDRM GIGGGMEVKY AIALVIMVVQ IGIAAWGFNA IKYFERYTMP 
AILLIMVAMT FMASFTVDIQ WSTSTVTGIA RWSAMSQLMT AIGIGWGISW LVYASDYTRF 
SKPGLKPSSV FKATFLGMFV PTVWLATLGA AIASAGVGSD PAQLIIAAFG VMALPVLLVL 
VHGPIATNIV VIYSAALSSL AMDINKPRWV VSLACGVAGS IILYGFMQSQ DFAHAFETFM 
VTMVVWISPW AGVTAADFFI MRRGSINVDE LYKPHTTSRL GDVNWTGVLS LLVGVFAAYL 
FQMSVVEVLQ GPLALGLGGI DLSWLAGFVV AFMAYIVSHK LRRTADVGAS ALTLPVRGE