Gene Clim_0631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0631
Symbol	trpD
ID	6354079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	709041
End bp	710096
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	53%
IMG OID	642668262
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001942697
Protein GI	189346168
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCCACA AGGATTTTCT TCACAAGCTG CTCTCCGGAG ACCATTTTTC GCAGGAGGAG 
ATGACTCAGT GCATGAACGC CATCATGAAC GGGGTTTTTC CTGATACCGT TATTGCCGCT 
CTGCTCGCTC TTCTGGAGCA CAAAGGGGTA ACCTCCACAG AAGTTGCCGG AGCGTATTAC 
AGTCTTATCG CAAAGGCCAA CACCATCGAT CTCTCTCCCG ATGCCGTCGA TACCTGCGGT 
ACCGGCGGCG ATCATGCCGG CACCTACAAT ATTTCCACTA TCGGCTCAAT CATCGCCAAC 
AGCACCGGCG TTTCCATTGC CAAACACGGA AACCGTTCGG TTACAAGCAG CTGCGGCAGC 
GCCGACGTGC TCGAGGAGCT TGGATTCCGT ATCGACCTGC CTGTGGAAGC CACCGTGGAA 
CTCTATGCCC GGACAGGGTT TTCATTCCTC TTCGCCCCGC TCTTCCACCC GTCGATGAAA 
CGGGTTGCCC ATATACGCAA GGAACTTGGC ATAAGAACCA TATTCAACAT GCTCGGCCCT 
CTTATCAACC CTGCGCGATC AAAAAGGCAG CTTGTCGGTG TTTACAGCAG CGAGCTCATG 
GAACTCTATA CCGAAGTGCT CCTGCAGACC GGTACACGCC ACGCCATGAT TGTGCATGCG 
ATGACTGAAG AAGGCGTCTC CCTCGATGAA CCAAGTCTTA ACGGACCGAC CTATATTGTT 
GAAATCCAGA ACGGATATGT CTGTCGGCAT ACAGTCTATC CGGAGGATTT CGGTCTCGAC 
AGACATCCGC TTTCGGCCAT TCAGGGAGGA GAGCGAAAGC AGAATGCCGC TATCATCAGA 
AGCATTCTCG ATGGCAGCGC TTCACCGGCG CAGATCGATG CAGCTCTCTA TACCTCGGCA 
ATGGCCTGTT ACGTATCCGG ACATGCAAGG TGCATCGATG ACGGCCTCAC CATATCAAGA 
GAATCGCTTG AAAGCGGCGA TACCGACAGA AAATTCAGGG AGATTCTTGA CTTTAACGCA 
GAACTTTCTG CCCGTTACAG GGAAGCGGTG AACTAA

Protein sequence

MGHKDFLHKL LSGDHFSQEE MTQCMNAIMN GVFPDTVIAA LLALLEHKGV TSTEVAGAYY 
SLIAKANTID LSPDAVDTCG TGGDHAGTYN ISTIGSIIAN STGVSIAKHG NRSVTSSCGS 
ADVLEELGFR IDLPVEATVE LYARTGFSFL FAPLFHPSMK RVAHIRKELG IRTIFNMLGP 
LINPARSKRQ LVGVYSSELM ELYTEVLLQT GTRHAMIVHA MTEEGVSLDE PSLNGPTYIV 
EIQNGYVCRH TVYPEDFGLD RHPLSAIQGG ERKQNAAIIR SILDGSASPA QIDAALYTSA 
MACYVSGHAR CIDDGLTISR ESLESGDTDR KFREILDFNA ELSARYREAV N