Gene Rleg_1203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1203
Symbol
ID	8012311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1178797
End bp	1180014
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	61%
IMG OID	644823787
Product	aminodeoxychorismate lyase
Protein accession	YP_002975037
Protein GI	241203941
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00148773
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGCGATA CGACGAACCA GAGCAACGAT ACCCAGGCGC AGAAGGGACC GATCATCCCG 
AAGTCGCCGA GCGAAGCCCT GCGTCCGGAA CGCGTTCCGG AGCCGCCGAA GCGGTCCAAG 
AAAGCCCGCG GCCAGGTCGT TCTTTTCCTG AACTTCATCA TGACGTTGGC GGTTCTGGTC 
TGTGTCGTCG CCATCATCGG CTTCTACTAC GCCACATCGA CCTATCGGAA TCCCGGTCCG 
CTGCAGACCA ACACCAATTT TATCGTCCGC AACGGCGCTG GTCTGACCGA AATCGCCTCG 
AACCTCGAGC GCAACGCGAT CATCAGCGAT GCCCGCATCT TCCGCTATCT CACGGCAACG 
CATCTTTCTG CCGGTGAGAG CCTCAAGGCG GGTGAATACG AGATCAAGGC GAGGGCATCC 
ATGAGAGATA TCATGGAGCT GCTGAAATCG GGCAAGTCCA TTCTCTATTC CGTTTCCTTC 
CCTGAGGGAC TGACGGTCCG ACAGATGTTC GACCGCATGC TGCAGGATAC CGTGCTGGAA 
GGCGACTTGC CGGCGGCATT GCCGACCGAG GGTAGCCTGC GTCCGGATAC CTACAAATTC 
TCGCGCGGCA CCAAGCGCTC GGAAATCATC GAACAGATGG CGGCTGCGCA GCAGAAGCTC 
GTCGATCAGA TCTGGGACAA GCGCGACTCG TCGCTGCCGC TGCGGTCCAA GGAAGAATTC 
GTGACACTCG CCTCGATCGT CGAAAAGGAA ACCGGCGTTC CCGACGAGCG AGCCCACGTC 
GCCTCCGTTT TCCTGAACCG GCTCGGCAAG GGCATGCGCC TGCAGTCCGA CCCGACGATC 
ATCTACGGCC TCTTCGGCGG CGAGGGCAAA CCGGCCGACC GGCCGATCTA CCAGTCGGAC 
CTGAAGCGGG ATACACCTTA CAACACCTAT GTCATCAAGG GTCTGCCGCC GACGCCGATC 
GCCAATCCCG GCAAGGATGC GCTGGAAGCC GTCGCCAATC CCTGGAAGAC GCAGGACCTC 
TATTTCGTCG CCGACGGCTC CGGTGGCCAT GTTTTCGCTG CGACGCTCGA GGAGCACAAT 
GCCAACGTCA AGCGCTGGCG CAAGCTCGAA GCCGACAAGG GGTCGGACCC GAACATCGCA 
GTCGACGGCC AGCCGGAAGA GCAGCCGGCG GATAGTGGCA CGACCGTCGC GCCGCCGAAG 
AAAAAGAAGA TCAACTGA

Protein sequence

MSDTTNQSND TQAQKGPIIP KSPSEALRPE RVPEPPKRSK KARGQVVLFL NFIMTLAVLV 
CVVAIIGFYY ATSTYRNPGP LQTNTNFIVR NGAGLTEIAS NLERNAIISD ARIFRYLTAT 
HLSAGESLKA GEYEIKARAS MRDIMELLKS GKSILYSVSF PEGLTVRQMF DRMLQDTVLE 
GDLPAALPTE GSLRPDTYKF SRGTKRSEII EQMAAAQQKL VDQIWDKRDS SLPLRSKEEF 
VTLASIVEKE TGVPDERAHV ASVFLNRLGK GMRLQSDPTI IYGLFGGEGK PADRPIYQSD 
LKRDTPYNTY VIKGLPPTPI ANPGKDALEA VANPWKTQDL YFVADGSGGH VFAATLEEHN 
ANVKRWRKLE ADKGSDPNIA VDGQPEEQPA DSGTTVAPPK KKKIN