Gene Sala_1174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1174
Symbol
ID	4080880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1209690
End bp	1211207
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	68%
IMG OID	638009535
Product	anthranilate synthase component I
Protein accession	YP_616223
Protein GI	103486662
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.917555
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCTGG AAGGCAGGGC CGCCGCGCTC GAAGCGCTGG CAGGGGGGCA CGGCGCGGTC 
GTCTGGCAAC GGTTGATCGC CGACATCGAA ACGCCGGTGT CGGCGGCGCT CAAGCTCATC 
GAACCGGAGC GCGGCGACTG GGTGCTCGAA TCGGTCGAAA GCGGCGAAAC GCGGGGCCGT 
TACAGCCTGA TCGGCCTCGA TCCCGATCTG ATGTTCGAAG TGCGCGGCGA CGCGGCGCGC 
ATCAACCGCG ACTGGCGGCA TGACCGCGAT GCCTTTGTCC CGGTCGAGGC AGGCGCCTTG 
CAGGCGCTGC GCGATCTGGT AGCCGAATGC CGGTTTGACG TGCCCGAAGG ATTGCCCAAG 
GCGCTTGCGA CGCTCGTGGG CTTCTTTGCC TATGAAACCA TCGGCCTCGT TGAACGCATT 
CCGCGGGCGC CGGGCGCGGG CCTCGGCCTG CCCGACATGA TTTTCGTGCG CCCGACGACG 
ATCCTCGTCT TCGACCGGCT GGCTGACGAA CTGTTCCTGA TCGCGCCGAT CTGGCCCGAC 
GCGCGCGGTG CCATCGACCG GATGATCGAT ACCGCCGGAG AGCGGCTCGA AAGCATCGCG 
GCGCGACTAT CGAGCGCGAG CCCGCACGCC GATGGGGCCT CGACCGCGGC GCTGACCCAA 
AGCATCACGG CGACGCCCGC GACGTCTCCT GAGCGCTTCG CGGCAATGGT CGCGGCGGCG 
AAGGATTATA TTGCGGCGGG CGATATTTTT CAGGTGGTGC TCTCGCAGCG TTTCTCGACC 
CCGTTCGACC TGCCGCCTTT CGACCTTTAC CGCGCGCTTC GCCGCGTCAA CCCGTCGCCC 
TTCCTCTATT TTCTCGACCT GCCGGGCTTT GCGCTGATCG GCTCGTCGCC CGAGATACTG 
GTGCGGGTGC GCGACGGCGA AATCACGATC CGCCCGATCG CGGGCACGCG CCCACGCGGG 
CGCACGAGTG CGGAGGACGC CGAGAATCGC GAAAGCCTGC TCGCCGATCC CAAGGAGCGC 
GCCGAGCATC TGATGTTGCT CGACCTGGGC CGCAATGACG TCGGCCGGGC AGCGATCGGC 
GGCAGCGTGT CCGTGACCGA CAGCTACACG GTCGAGTTCT ACAGCCATGT GATGCACATC 
GTGTCGAATG TCATCGGCCG CATCGCGCCG GGCAAGGACG CGATCGACGC GCTGTTCGCG 
GGCTTCCCCG CCGGAACCGT CAGTGGCGCG CCCAAGGTTC GCGCGTGCCA GATCATTGCC 
GAACTGGAAG CCGATGCGCG CGGCCCCTAT GCGGGCGGCG TCGGCTATTT CGCGCCCGAC 
GGCAATATGG ACAGCTGCAT CGTGCTGCGC ACCGCGATCG TCAAGGACGG CGTGATGCAC 
GTCCAGGCGG GTGCGGGGAT CGTCGCCGAC AGCGACCCGG CTTACGAACA GCGTGAGTGC 
GAGGCGAAGG CGGGAGCGCT CTTTGCCGCG GCGCGCGAGG CGGTGCGGAT CGCGGGGACC 
GCGGGATACG GGCAGTAG

Protein sequence

MTLEGRAAAL EALAGGHGAV VWQRLIADIE TPVSAALKLI EPERGDWVLE SVESGETRGR 
YSLIGLDPDL MFEVRGDAAR INRDWRHDRD AFVPVEAGAL QALRDLVAEC RFDVPEGLPK 
ALATLVGFFA YETIGLVERI PRAPGAGLGL PDMIFVRPTT ILVFDRLADE LFLIAPIWPD 
ARGAIDRMID TAGERLESIA ARLSSASPHA DGASTAALTQ SITATPATSP ERFAAMVAAA 
KDYIAAGDIF QVVLSQRFST PFDLPPFDLY RALRRVNPSP FLYFLDLPGF ALIGSSPEIL 
VRVRDGEITI RPIAGTRPRG RTSAEDAENR ESLLADPKER AEHLMLLDLG RNDVGRAAIG 
GSVSVTDSYT VEFYSHVMHI VSNVIGRIAP GKDAIDALFA GFPAGTVSGA PKVRACQIIA 
ELEADARGPY AGGVGYFAPD GNMDSCIVLR TAIVKDGVMH VQAGAGIVAD SDPAYEQREC 
EAKAGALFAA AREAVRIAGT AGYGQ