Gene Rpal_4991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4991
Symbol
ID	6412683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5372632
End bp	5374791
Gene Length	2160 bp
Protein Length	719 aa
Translation table	11
GC content	67%
IMG OID	642714874
Product	anthranilate synthase
Protein accession	YP_001993955
Protein GI	192293350
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I [COG0512] Anthranilate/para-aminobenzoate synthases component II
TIGRFAM ID	[TIGR00566] glutamine amidotransferase of anthranilate synthase or aminodeoxychorismate synthase [TIGR01815] anthranilate synthase, alpha proteobacterial clade

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGGA CCGTTTTCTC GCTTCCCGCG ACCAGCGACT ATAAGACCGC CGCGGGCCTC 
GCGGTGACGC GCAGCGCCCA GCCTTTTGCC GGCGGCCAGG CGCTCGACGA GCTGATCGAT 
CTGCTCGACC ACCGCCGCGG CGTGATGCTG TCGTCCGGCA CAACCGTGCC GGGCCGCTAC 
GAGAGCTTCG ACCTCGGCTT TGCCGATCCG CCGCTGGCGC TCACCACTAG GGCCGAAAAA 
TTCACCATCG AGGCGCTCAA TCCGCGCGGC CGGGTGCTGA TCGCGTTCCT GTCCGACAAG 
CTTGAAGAGC CCTGCGTCGT CGTCGAGCAG GCCTGCGCCA CCAAGATCAG GGGCCACATC 
GTCCGCGGCG AGGCCCCGGT CGACGAAGAA CAACGCACCC GCCGCGCCAG CGCGATCTCT 
CTGGTGCGCG CGGTGATTGC TGCCTTCGCC TCGCCGGCCG ATCCGATGCT CGGACTGTAC 
GGCGCCTTCG CCTACGACCT GGTGTTCCAG TTCGAGGATC TGAAGCAGAA GCGTGCCCGC 
GAAGCCGACC AGCGCGACAT CGTGCTGTAC GTGCCGGATC GCCTGCTGGC CTATGACCGC 
GCCACCGGCC GCGGCGTCGA CATTTCCTAC GAATTCGCCT GGAAGGGCCA TTCCACCGCC 
GGCCTGCCGA ACGAAACCGC CGAGAGCGTC TACACCCAGA CCGGCCGGCA GGGTTTCGCC 
GACCACGCCC CGGGCGACTA TCCCAAGGTG GTCGAGAAGG CCCGCGCGGC GTTCGCCCGT 
GGCGACCTGT TCGAGGCGGT GCCGGGCCAG TTGTTCGGTG AGCCGTGCGA GCGGTCGCCG 
GCCGAAGTGT TCAAGCGGTT GTGCCGGATC AACCCGTCGC CCTATGGCGG CCTGCTCAAT 
CTCGGCGCCG GCGAATTCCT GGTGTCGGCC TCGCCGGAAA TGTTCGTCCG CTCGGACGGC 
CGCCGGATCG AGACCTGCCC GATCTCCGGC ACCATCGCCC GCGGCGTCGA TGCGATCAGC 
GATGCCGAGC AGATCCAGAA GCTCTTGAAC TCCGAGAAAG ACGAGTTCGA GCTGAATATG 
TGCACCGACG TCGACCGCAA CGACAAGGCG AGGGTCTGCG TGCCGGGCAC GATCAAGGTG 
CTGGCGCGCC GCCAGATCGA GACCTACTCG AAACTGTTCC ACACCGTCGA CCATGTCGAA 
GGCATGCTGC GGCCGGGCTT CGACGCGCTC GACGCCTTCC TCACCCACGC CTGGGCGGTC 
ACGGTCACCG GCGCGCCGAA GCTGTGGGCG ATGCAGTTCG TCGAGGATCA CGAGCGCAGC 
CCGCGACGCT GGTATGCCGG CGCGTTCGGC GTGGTCGGCT TCGATGGCTC GATCAACACC 
GGCCTCACCA TCCGCACCAT CCGGATGAAG GACGGCCTCG CCGAAGTTCG CGTCGGCGCC 
ACCTGCCTGT TCGACAGCGA TCCGGTCGCC GAAGACAAGG AATGCCAGGT CAAGGCCGCG 
GCGCTGTTCC AGGCGCTGCG CGGCGATCCG GCCAAGCCGC TGTCGGCGGT GGCGCCGGAC 
GCCACTGGCT CGGGCAAGAA GGTGCTGCTG GTCGACCACG ACGACAGCTT CGTGCACATG 
CTGGCGGACT ATTTCCGTCA GGTCGGCGCC CAGGTCACTG TGGTGCGCTA CGTTCACGGC 
CTGAAGATGC TGGCCGAAAA CAGCTATGAT CTTCTGGTGC TGTCGCCCGG TCCCGGCCGG 
CCGGAGGACT TCAAGATCAA GGATACGATC GACGCCGCGC TCGCCAAGAA GCTGCCGATC 
TTCGGCGTCT GCCTCGGCGT CCAGGCGATG GGCGAATATT TTGGCGGTAC GCTCGGCCAG 
CTCGCGCAGC CGGCTCACGG CCGCCCGTCG CGGATCCAGG TGCGCGGCGG CGCGCTGATG 
CGCGGTCTCC CGAACGAGGT CACCATCGGC CGCTACCACT CGCTCTATGT CGACATGCGC 
GACATGCCGA AGGAGCTGAC CGTCACCGCC TCCACCGATG ACGGCATCGC GATGGCGATC 
GAGCACAAGA CCCTGCCGGT CGGCGGCGTG CAGTTCCACC CCGAGTCGCT GATGTCGCTC 
GGCGGCGAGG TCGGGCTGCG GATCGTCGAA AACGCATTCC GGCTCGGCCA GGCGGCCTAA

Protein sequence

MNRTVFSLPA TSDYKTAAGL AVTRSAQPFA GGQALDELID LLDHRRGVML SSGTTVPGRY 
ESFDLGFADP PLALTTRAEK FTIEALNPRG RVLIAFLSDK LEEPCVVVEQ ACATKIRGHI 
VRGEAPVDEE QRTRRASAIS LVRAVIAAFA SPADPMLGLY GAFAYDLVFQ FEDLKQKRAR 
EADQRDIVLY VPDRLLAYDR ATGRGVDISY EFAWKGHSTA GLPNETAESV YTQTGRQGFA 
DHAPGDYPKV VEKARAAFAR GDLFEAVPGQ LFGEPCERSP AEVFKRLCRI NPSPYGGLLN 
LGAGEFLVSA SPEMFVRSDG RRIETCPISG TIARGVDAIS DAEQIQKLLN SEKDEFELNM 
CTDVDRNDKA RVCVPGTIKV LARRQIETYS KLFHTVDHVE GMLRPGFDAL DAFLTHAWAV 
TVTGAPKLWA MQFVEDHERS PRRWYAGAFG VVGFDGSINT GLTIRTIRMK DGLAEVRVGA 
TCLFDSDPVA EDKECQVKAA ALFQALRGDP AKPLSAVAPD ATGSGKKVLL VDHDDSFVHM 
LADYFRQVGA QVTVVRYVHG LKMLAENSYD LLVLSPGPGR PEDFKIKDTI DAALAKKLPI 
FGVCLGVQAM GEYFGGTLGQ LAQPAHGRPS RIQVRGGALM RGLPNEVTIG RYHSLYVDMR 
DMPKELTVTA STDDGIAMAI EHKTLPVGGV QFHPESLMSL GGEVGLRIVE NAFRLGQAA