Gene Rxyl_2115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_2115
Symbol
ID	4114711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	-
Start bp	2143995
End bp	2145524
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	72%
IMG OID	638036901
Product	anthranilate synthase, component I
Protein accession	YP_644871
Protein GI	108804934
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.332687
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACAGGCA CCGCTAGGCT GGAGCTGGTC CCCTCTTTGG GCGAGGCGCG GAGGCTCGCC 
CGCGCCCACG ACGTGGTCCC CGTGTACGCC GAGTTCATCG GGGACCTGGA GACCCCCATC 
TCCGCGGTGT TGCGGTTCGC CGGCGAGGAG CACGTCTTTT TGCTGGAGAG CGCCGAGGCG 
GCCGAGCGCT TCGGGCGCTA CTCCTTTCTC GGCTTCGACC CAAAGCGCAC CCTCTCCTAC 
CGGCGGGGGA CCTACACCGT GGTGGACGCC GACGGGGTGC GGGAGCTCCC CGCGAAGGAC 
CCCTTCCGGG GGCTCGCCGC CATCGTGGGG CGAAAGAGCG TCGCCCCGCT GCCCCACCTT 
CCGGCCTTCG TCGGGGGGGC GGTGGGCTAC TTCGCCTACG ACGCTGTGCG CTACCTGGAG 
CGGCTGCCGG AGGCCCCCCC GGACGACCTC GGCGTCCCGG AGGCGTACTT CGCCATCACC 
GACACGCTGG TGGTCTTCGA CCACCTCAGG CACAAGGTGC TGGTGATCTC GCTGGTCGAC 
GCCTCCAGGC TGCGCGACGT GCAGGGCGAG GGGTTCGCCG CGGCCTACCG CCGGGCCGCC 
GACGACATCC GGCGGGTTGC CGAGCAGCTC GCGGCCCCGC TCGAGCGCGG GAGGGGCCTC 
TCCTCCGGCC CGCCGGGGAG GCTCGAGATC TCCTCCAACT TCACCCGCGG GGCCTACGAG 
GCGGCCGTCG AGCGGGCCAA GGAGTACATC CGGGCGGGGG ACGCCTTCCA GATAGTGCCC 
TCCCAGCGCT TTGCGGCCGA GGTGGGCGAC CTGGACCCGC TGCTGCTCTA CCGGGGGCTC 
AGGACGGTGA ACCCCTCCCC CTATATGACC TACCTGAAGT TCGGTGACCT GGCGCTGGTG 
GGGGCCTCCC CGGAGCCGCT GGTGCGGGTC GAGGGGCGGC GGGTGATGAC CCGCCCCATA 
GCGGGCACCC GGCGGCGCGG GGAGAGCCCG GAGGAGGACG CGGCGCTGGC CGGGGAGCTG 
CTCGCCGACG CCAAGGAGCG GGCGGAGCAC GTGATGCTCG TGGACCTCGG GCGCAACGAT 
CTGGGGCGGG TCTGCGAGGT CGGAAGCGTG GAGGTCACGA GCTTTATGGA GATAGAGCGC 
TACTCGCACG TGATGCACAT CGTCTCCACG GTGGAGGGAA ACCTGCGGGA GAACCTCACG 
GCGCTCGACG CCCTCGCCGC GGCCTTCCCC GCGGGGACCG TCTCGGGGGC CCCGAAGGTG 
CGGGCGATGG AGATCATCGA CGAGCTCGAG CCAACCCGCC GCGGGCCCTA CGCGGGGGCC 
ACCGGCTACT ACGGGGTGGA CGGGCGGCTG GACACCTGCA TCACCCTGCG CACGGCGCTG 
CTGAAGGGCG GCCGCGCCTA CTTCCAGGCC GGCGGCGGGG TGGTCGCCGA CTCGGTCCCG 
AAGCTGGAGT ACGAGGAGAC CCGCAACAAG GCGCGGGCGA TGGAGCGGGC GCTGGAGGTG 
GCCAGGAGCC CGCGGCTCTG GCTGGGCTGA

Protein sequence

MTGTARLELV PSLGEARRLA RAHDVVPVYA EFIGDLETPI SAVLRFAGEE HVFLLESAEA 
AERFGRYSFL GFDPKRTLSY RRGTYTVVDA DGVRELPAKD PFRGLAAIVG RKSVAPLPHL 
PAFVGGAVGY FAYDAVRYLE RLPEAPPDDL GVPEAYFAIT DTLVVFDHLR HKVLVISLVD 
ASRLRDVQGE GFAAAYRRAA DDIRRVAEQL AAPLERGRGL SSGPPGRLEI SSNFTRGAYE 
AAVERAKEYI RAGDAFQIVP SQRFAAEVGD LDPLLLYRGL RTVNPSPYMT YLKFGDLALV 
GASPEPLVRV EGRRVMTRPI AGTRRRGESP EEDAALAGEL LADAKERAEH VMLVDLGRND 
LGRVCEVGSV EVTSFMEIER YSHVMHIVST VEGNLRENLT ALDALAAAFP AGTVSGAPKV 
RAMEIIDELE PTRRGPYAGA TGYYGVDGRL DTCITLRTAL LKGGRAYFQA GGGVVADSVP 
KLEYEETRNK ARAMERALEV ARSPRLWLG