Gene Haur_2688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2688
Symbol	trpD
ID	5734569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3445835
End bp	3446851
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	55%
IMG OID	641279831
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001545454
Protein GI	159899207
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0984647
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGATTC GCGATGCGAT TATTACGGTT ACCAATCGAA CGGATTTAAG CCAAGACGAT 
GCGGCGGCGG TGATGGAGCA GATGATGAAT GGCGAGGCCA CGCCAGCCCA AATCGCGGCC 
TTGCTCACGG CGTTACATTT CAAAGGTGAA ACTGACGCAG AAATTGCTGG TATGGCCCAA 
GTGATGCGGG CTAAATCGCT TGCCGTGCCC CACGATGGCG GCGTGGTCGA TACCTGTGGC 
ACTGGTGGCG ATCATTCAAA TACCTTCAAT ATTTCAACGA CTGCAGCGTT TGTGGCAGCA 
GGTGCAGGCG CAACCGTCGC CAAACACGGC AATCGCGCTA TGTCGTCGAA ATGTGGATCA 
GCCGATGTGC TCGAAGGTTT GGGGGTCAAT ATCGAGCTTG ATGCTGAAGG TGTGGCCCGC 
TGTTTGCGCC AAGCAGGCAT CGGCTTTATG TTTGCGCCTA AGTTTCATCC CGCAATGCGT 
TATGCTGGGC CAGTGCGCCG CGAAATTGGC ATTCGCACGA TTTTCAATGT CTTGGGGCCA 
CTGACCAACC CAGCCCGCGC CGAATATCAG GTGATTGGGG TTGCTAACGC AGGTTTGGCC 
GAAAAATTGG CCAATGCTCT AAGCAAAATG GGTATTCGCC GTGCCTTGGT GGTGCATGGC 
AGCGATGGGC TTGATGAAAT TTCAATCAGC GCCTCAACCT TGGTGTTTGA TGTGCGAGCT 
GGGGCTACTC CCCAAGCCTC GACAATTAGC CCTAGTGATT TTGGTCTAAG CCTTGCGCCG 
CGTGAAGCAA TTGCTGGTGG CTCAGTCGAG GAAAATGTGG CCATGACCAA GGCAATTCTT 
GAGGGTAGCG ATACTGGCCC ACGTCGCGAT ATTGTGCTCT TGAATGCCGC CGCCGCATTG 
GTTGCTTGTG AACGCGCCGA TTCGTTTGGC GAGGCTTTGC GTCAAGCTCA ACAGGCCATC 
GACACTGGCA GCGCCAATCA GCGTATGCAA CGAATGATCG AGGCCAGCAA CGGCTAG

Protein sequence

MQIRDAIITV TNRTDLSQDD AAAVMEQMMN GEATPAQIAA LLTALHFKGE TDAEIAGMAQ 
VMRAKSLAVP HDGGVVDTCG TGGDHSNTFN ISTTAAFVAA GAGATVAKHG NRAMSSKCGS 
ADVLEGLGVN IELDAEGVAR CLRQAGIGFM FAPKFHPAMR YAGPVRREIG IRTIFNVLGP 
LTNPARAEYQ VIGVANAGLA EKLANALSKM GIRRALVVHG SDGLDEISIS ASTLVFDVRA 
GATPQASTIS PSDFGLSLAP REAIAGGSVE ENVAMTKAIL EGSDTGPRRD IVLLNAAAAL 
VACERADSFG EALRQAQQAI DTGSANQRMQ RMIEASNG