Gene Cag_1741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1741
Symbol	trpD
ID	3746874
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2260325
End bp	2261380
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	47%
IMG OID	637774278
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_380035
Protein GI	78189697
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATCAA AACAATTGCT TCAAAAGCTG CTTGCAGGCG AGCACTGCTC AAAAGAGGAG 
ATGCAAGACT GCATGAATAG CATTATGGAT GGTGAGTTTT CGGATAGTGT TATTGCGGCT 
TTGTTGGCGT TGCTGCAAAA AAAGGGCGTG GTGGCAAATG AGCTTGCGGG AGCACATGCA 
AGTTTAATGG CTCATGCAAC CACCGTTGCA TTAAGCACGC ATGCGGTTGA TACATGTGGC 
ACAGGTGGCG ACCATGGTGG CACGTACAAT ATTTCAACCA CAGCCTCGCT TATTGCGTGT 
AGTGCTGGTG TTCGAGTAGC AAAGCATGGT AACCGTTCGG TAACCAGCAG TTGTGGTAGT 
GCCGATGTGC TGGAAGCGCT GGGATTTACG CTTGAGCTTC CACCTGAGGC AACCATTTCG 
CTCTTTAAAA AAACAGGTTT TGCCTTCCTT TTTGCCCCCT TGTACCATCC ATCAATGAAG 
CGCGTGGCTC ATATTCGTCG CGAACTTGGC ATTCGTACTC TTTTCAACAT GCTTGGACCG 
TTGCTTAATC CAGCACAAGT TAAGCGGCAG CTTGTTGGCG TTTTTAGTGA GGAGTTGTCG 
GAACTCTACG CAGACGTACT TTTGCAAACA GGGGCACGCC ATGCGCTTAT TGTACATGCA 
AGTACCGAAG AGGGTGTTAT ACTTGATGAG CCAAGTTTAA ATGGCACAAC CTTTGTTACA 
GAAATTGAGA AAGGCGTTGT GCGCAAACAC ACCCTTCGTC CCGAAGAGTT TGGCATTGCA 
CCAGCTCCTC TTGCTGCGCT ACAAGGAGGC GATAAGGAAC ATAATGCCCG AATTATTCAA 
AGCATTGCAG ATGGAAGTGC CTCAGCAGCA CAGCGCGATG CAGCACTCTA CTCAAGTGCT 
ATGGCATGTT ACGTTGGAGG CAAGTGTGCT TGCTTAAATG ATGGTTTTAT AGTAGCTAAA 
GAGGCTTTGG AAAGCGGCAA AACACAAGCT AAACTCAAAG AGATTATTGC CTATAATCAA 
GCGTTAGTAA CTGAATACCA TGTGGCAAAA TCTTAA

Protein sequence

MESKQLLQKL LAGEHCSKEE MQDCMNSIMD GEFSDSVIAA LLALLQKKGV VANELAGAHA 
SLMAHATTVA LSTHAVDTCG TGGDHGGTYN ISTTASLIAC SAGVRVAKHG NRSVTSSCGS 
ADVLEALGFT LELPPEATIS LFKKTGFAFL FAPLYHPSMK RVAHIRRELG IRTLFNMLGP 
LLNPAQVKRQ LVGVFSEELS ELYADVLLQT GARHALIVHA STEEGVILDE PSLNGTTFVT 
EIEKGVVRKH TLRPEEFGIA PAPLAALQGG DKEHNARIIQ SIADGSASAA QRDAALYSSA 
MACYVGGKCA CLNDGFIVAK EALESGKTQA KLKEIIAYNQ ALVTEYHVAK S