Gene Sala_0836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0836
Symbol	trpD
ID	4080044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	842002
End bp	843000
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	70%
IMG OID	638009195
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_615887
Protein GI	103486326
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0270172
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00485559
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCCGGT TCGGGCCATT TCCCGACCCT TCGGCGCTGC TCGACCATGA CGAGGCGGCG 
CACGCCTTCG CAACGATGCT CGATGGCGGT GCGCGCGACG AACAGATCGC CGCGTTTCTG 
GTCGCGCTCG CCGACCGCGG CGAAACGATG GTCGAAATCG CCGCCGCGGC ACAGGCGATG 
CGCGATCGGC TGATCCCCAT CGAGGCGCCG GCGGGCGCGA TCGACGTGTG CGGCACCGGC 
GGCGACGGAC ACCACACGCT CAACGTCTCG ACGGCGGTGT CGATCGTCGT CGCGGCGTGC 
GACGTGCCGG TCGCAAAGCA CGGCAATCGC GCGGCTTCGT CGAAATCGGG CGCCGCCGAC 
ACGCTGGAGG CGCTTGGCCT CGACATGGAG CGCGCCGATC GTCAGGCGCA GGAACAGCTC 
GCCGACCTCG GCATCTGTTT CCTCTTCGCC GGGACGCGCC ACCCTGCGAT GAAGCGCATC 
ATGCCGATCC GCAAGGCGAT CGGGCGGCGG ACGATCTTCA ACCTGATGGG GCCGCTCGCC 
AATCCCGCGC GCGTCACCCG CCAGCTTGTC GGCATCGCGC GCCCCGCCTA TGTGCCCGTC 
TATGCCGAGG CGCTGCACCG GCTCGGCACC GATCATTCGC GCGTCATTTC GGGCGACGAG 
GGGCTCGACG AACTCTCGCT CGCGGGCGGC AACGAGGTCG CGGTGGTGAC CCCCGACGGC 
GTGCGGATGC AGCGCAGCAG CGCCGCCGAC GCCGGGCTGC CGACGCGCTC GCTCGCCGAA 
ATCCGCGGCG GCGATGCGGC GTTCAACGCC CGCGCGCTGC GCCGCCTGCT CGAAGGCGAA 
ACCGGCGCGT ACCGTGACGC GGTACTCTAC AACGCCGCCG CGGCGCTGAT CGTCGCGGGC 
GCGGTCGACA CGCTGACGGA GGGGGTCGAG GAAGCCGCCG AAGCGATCGA CAAGGGCCTC 
GCCAACGCGC TGCTCAACTG CTGGATCGCG TATAAATGA

Protein sequence

MSRFGPFPDP SALLDHDEAA HAFATMLDGG ARDEQIAAFL VALADRGETM VEIAAAAQAM 
RDRLIPIEAP AGAIDVCGTG GDGHHTLNVS TAVSIVVAAC DVPVAKHGNR AASSKSGAAD 
TLEALGLDME RADRQAQEQL ADLGICFLFA GTRHPAMKRI MPIRKAIGRR TIFNLMGPLA 
NPARVTRQLV GIARPAYVPV YAEALHRLGT DHSRVISGDE GLDELSLAGG NEVAVVTPDG 
VRMQRSSAAD AGLPTRSLAE IRGGDAAFNA RALRRLLEGE TGAYRDAVLY NAAAALIVAG 
AVDTLTEGVE EAAEAIDKGL ANALLNCWIA YK