Gene Caul_2777 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2777
Symbol	trpD
ID	5900232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3014879
End bp	3015922
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	72%
IMG OID	641563269
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001684402
Protein GI	167646739
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.000134722
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000003256
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTGACG CCTTCAAGCC CCTGCTGGCC AAGCTGGCCG ACGGCCAGAC CCTCGACGAG 
GACGACGCCG AGCAGTTCTT CGCCGCCTGC CTGCGCGGCG AGCCGACCCC GGCCCAGGTG 
GCCGCGGCGG TCACGGCCAT GCGCCTGCGC GGCGAGACGG TGGGCGAAAT CACCGCCTGC 
GCCCGCGCCA TGCGCCGCGC CGCCATCCAC CTGGACCATC CCTATGAGGT GATCGACGTC 
TGCGGCACCG GCGGCGACGG CCTGCACACC CTGAACATCT CCACCGCCGT GGGCTTCGTG 
GCCGCTGGCG GCGGCCTGAA GGTGGCCAAG CACGGCAACC GGGCGATCAC CAGCAAGTCG 
GGGACCGCCG ACGTCCTGGC GGCCCTGGGG GTCAATATCG ACGCCAGCCT GGCCCAGCAG 
CGCCACGCGC TGGATACGGC CGGCATCTGC TTCCTGTTCG CCCAGGCCCA CCACGGCGCG 
ATGAAGCATG TCTCGCCCAT CCGCCAGCAG CTGGGCTTCC GCACCATCTT CAACCTGCTG 
GGTCCGCTGA CCAATCCGGC CGGCGCCAAG CGCCAGGTGG TCGGCGTCTC GGCTCACCGA 
TTCGTCGAGC CGGTGGCCAA GGCCCTGGGC GCCCTGGGAG CCGAGCGCGC CTGGTCGGTG 
CACGGGGCCG GCATGGACGA ACTGACCACC ACCGGCGAGA CCGAGGTCGC CGAATGGCGC 
GACGGCAGCT TGCGCCTGTT CACGATCACT CCCGAAGCCG TCGGCCTGCC GCGCGCCGCC 
CTGGCCGACA TCACCGGCGG CGATCCCGCC TATAACGCCG CCGCCCTGAC CGCCCTGCTG 
GACGGCCAAA AGGGCGCCTA TCGCGACATC GTCATGCTCA ACGCCGCCGC CGCCTTCCTG 
GTGGCCGACA GGGTCGAGAC CCTGCGCGAG GGCGTCGAAC TGGCCGGCGC CGTTCTGGAC 
GACGGCCGCG CCAAGGCGGC CCTCGCCGGT CTGGTCGCCG CCACCAACAG TGAAACCGTA 
CCCGCCCAAG TGACCCCAGC ATGA

Protein sequence

MSDAFKPLLA KLADGQTLDE DDAEQFFAAC LRGEPTPAQV AAAVTAMRLR GETVGEITAC 
ARAMRRAAIH LDHPYEVIDV CGTGGDGLHT LNISTAVGFV AAGGGLKVAK HGNRAITSKS 
GTADVLAALG VNIDASLAQQ RHALDTAGIC FLFAQAHHGA MKHVSPIRQQ LGFRTIFNLL 
GPLTNPAGAK RQVVGVSAHR FVEPVAKALG ALGAERAWSV HGAGMDELTT TGETEVAEWR 
DGSLRLFTIT PEAVGLPRAA LADITGGDPA YNAAALTALL DGQKGAYRDI VMLNAAAAFL 
VADRVETLRE GVELAGAVLD DGRAKAALAG LVAATNSETV PAQVTPA