Gene Rleg_1314 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1314
Symbol
ID	8012412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	1295801
End bp	1297042
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	62%
IMG OID	644823896
Product	hypothetical protein
Protein accession	YP_002975145
Protein GI	241204049
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGACGC AAAAGCTCGA TGTCCATGAA CAGCCGTCCG ACGACGTGGC GCTGGCCGAT 
ACGGCCATTT CGCGCCTGCG CCAGCTGAGC ATGAAACTCG CCATGGCTGA AATCGACATC 
GAAGTCTTCG ATACGATGCA GCCGCTGGAG GATGAGTGGC GGGCGCTGGA GCGCGACAAT 
CTCCAGTCCC TGCATCAGAG CTACGACTGG TGCGCCGCCT GGGTGAGCGC CTTCCAGCGG 
CCGCTTGCGA TCCTCAAAGG CACTCATGCG GGTCAGACCG CCTTCATTCT GCCGGCCGAG 
ATCGTCAAGT CTCGCGGGCT CACGACGGCG AAATTCATCG CCGCCGATCA CAGCAATATC 
AATACCGGCC TATTCGCAGA GAGCTTTGCC GAAGCCGGCA GGACCATCGC CCCCCATGAG 
TTCGCCGGCC GGCTCCGGCA TGCGCTGAAG GGCCGCGCCG ATCTGCTGCT GCTGCAGAAC 
ATTCCGCTGG AATGGCGTGG GCGCGAGAGC CCGCTCGCCG GGCTGCCGGT GGTGCAGAAC 
CAGAATCACG CCTATCAGCT GCCGTTCCTT CCCGCTTTCG AGGACACGCT GAAGCAGCTC 
AACGCCAAGA ACCGGCGCAA GAAATTCCGT GTTCAGTCGA AGCGCCTCGA GGCGGCCGGC 
GGCTTCGAAT ACCTCATTCC TCGGACATCG GAAGAACAGC ACGGCCTGCT CGATATCTTC 
TTCCGCCTGA AAAGCGCCCG TTTCGCCAGC CTTGGCCTGC CCGACGTCTT TGCCGATAGG 
GAGACGCAGA CCTTCCTGCA CGGTCTCATC GACAAGCGGG ACGACACCAG GCAGTATTTC 
GGGCTGCAGA TGCATATGCT CCGGCTCAAG GGCGAACTTG AGGGTAAGAT CGCCGCGATA 
TCAGGCATCT CGCGCAAGGG TGACCATATC ATCTGCCAGT TCGGCGCGAT CGACGAAGAG 
CTCGTGCCGG ATACGAGCCC CGGCGAATTC CTCTATTGGC AGACCATCTC GGGACTGCAT 
GGCAAGGGTG TCGCACTGTT CGATTTCGGC CTCGGCGACC AGACCTACAA GCGTTCCTGG 
GCGCCGGTCG AGACCGCGCA TTATGACGTG GTGCTGCCGG TATCGCCGTT CGGCGTCGTC 
GCCGGCGCCG CTCACCGGAT CGTCACCCAC GGCAAGGCGC ACATCAAGGC GCGCCCGAAG 
CTCTATAAAT TCGCCCAAGG CATCCGGGCA CGGATCGGCT AG

Protein sequence

MQTQKLDVHE QPSDDVALAD TAISRLRQLS MKLAMAEIDI EVFDTMQPLE DEWRALERDN 
LQSLHQSYDW CAAWVSAFQR PLAILKGTHA GQTAFILPAE IVKSRGLTTA KFIAADHSNI 
NTGLFAESFA EAGRTIAPHE FAGRLRHALK GRADLLLLQN IPLEWRGRES PLAGLPVVQN 
QNHAYQLPFL PAFEDTLKQL NAKNRRKKFR VQSKRLEAAG GFEYLIPRTS EEQHGLLDIF 
FRLKSARFAS LGLPDVFADR ETQTFLHGLI DKRDDTRQYF GLQMHMLRLK GELEGKIAAI 
SGISRKGDHI ICQFGAIDEE LVPDTSPGEF LYWQTISGLH GKGVALFDFG LGDQTYKRSW 
APVETAHYDV VLPVSPFGVV AGAAHRIVTH GKAHIKARPK LYKFAQGIRA RIG