Gene Rcas_2153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2153
Symbol	trpD
ID	5539633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2764760
End bp	2765782
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	67%
IMG OID	640894286
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001432255
Protein GI	156742126
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.286108
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00266226
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCAATCC GTGATCAGAT TATCCAGATC GTTCGGGGTC ATGATCTCAC CGAAGAGCAG 
GCTGCCGAAG CGATGGAAGA AATTATGACC GGCGTGGCGA CCCCGGCGCA GGTCGCGGCG 
CTGCTCACAG CGCTCCACCT GAAGGGCGAA ACCGACGCCG AGATCGCCGG CATGGCGCGG 
GTTATGCGCG CCAAAGCCAT CCCCGTCCAC TTCGACGGTC CGCTGCTCGA CACATGCGGC 
ACCGGCGGCG ACAGCGCCGG CACGTTCAAC ATTTCGACGA CCGCCGCGTT CATCGCGGCA 
GGCGCCGGCG CAACGGTCGC CAAGCACGGC AACCGTGCCA TGTCGAGTGT CTGCGGCTCT 
GCCGACGTGC TCGAAGGGCT GGGGGTCACC ATCGATCTCG ACGCCGCTGG CGTGGCGCGC 
TGTCTCGAAC AGGCGGGCAT TGGGTTCATG TTCGCACAGA AGTTCCATCC GGCGATGCGC 
TTTGTCGGAC CGGTGCGCCG TGAGATCGGC ATCCGCACCA TCTTCAACGC CCTCGGTCCG 
TTGAGCAACC CGGCGCAGGC ACGCCACCAG ACGCTTGGTG TCGCCGATCC GGCGCTGGCG 
GAGAAGATGG CGCGCGCGCT TTACCTTCTC GGCGCGCAGC ATGCTCTGGT CGTTCATGGG 
CACGGCGGGC TGGATGAACT GACCCTGAGC GGACCGAACC TCGTCATCGA AGTGCGTGCC 
GGTCACAAGC CGCGACGGTA TGAGGTCAGC GCCGGCGACC TGGGGCTGAC GCCTGCCCCG 
CGCGAGGCGC TGCTCGGCGG CGATGTATCG ACGAACGTGG CGATTGTTCG CGCCATTCTC 
AGCGGAGAAG AACGGGGAGC ACGGCGCGAC GTGGCGTTGC TGAACGCCGC CGCCGCTCTT 
GTTGCCGCCG ACTACGCCGC CGACCTGCGC GAGGGGTTGC AGCAGGCGCG GCAGAGCCTT 
GAGAGTGGCG CCGCCCTGGC GCGCCTGGAG CGGCTTATCA CGGTCAGTAG CATCAACCGT 
TGA

Protein sequence

MPIRDQIIQI VRGHDLTEEQ AAEAMEEIMT GVATPAQVAA LLTALHLKGE TDAEIAGMAR 
VMRAKAIPVH FDGPLLDTCG TGGDSAGTFN ISTTAAFIAA GAGATVAKHG NRAMSSVCGS 
ADVLEGLGVT IDLDAAGVAR CLEQAGIGFM FAQKFHPAMR FVGPVRREIG IRTIFNALGP 
LSNPAQARHQ TLGVADPALA EKMARALYLL GAQHALVVHG HGGLDELTLS GPNLVIEVRA 
GHKPRRYEVS AGDLGLTPAP REALLGGDVS TNVAIVRAIL SGEERGARRD VALLNAAAAL 
VAADYAADLR EGLQQARQSL ESGAALARLE RLITVSSINR