Gene Hhal_2080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2080
Symbol
ID	4709990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2283726
End bp	2284754
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	70%
IMG OID	639856554
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001003646
Protein GI	121998859
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCTAA CCGCCGCCCT TCGTCGCATC ACGGAGAACC AGGATCTCAG CCCCGATGAG 
ATGACCGCGG TCTTCCGCAC CATCATGACC GGCGGGGCGA CGCCGGCGCA GATCGGTGGC 
TTCCTCATCG GCATGCGGCT CAAGGGGGAG ACGGTCCAGG AGATGGCCGC CGCCGCCTCG 
GTCATGCGGG AGCTCGCCGA GCGGGTCGAT GTCGGCGACG ACTTCCACCG CCTGGTGGAC 
ACCTGCGGCA CCGGTGGCGA TGCCCGCGGC ACCCTGAACG TCTCGACCGC CGCCGCCTTC 
GTGACCGCCG CCGGGGGCAT CCCGGTGGCC AAGCACGGCA ACCGCTCGGT CTCCGGGCGC 
AGCGGCAGCG CCGACCTGCT CGAGGCCTGC GGCGCCACGC TGGAACTCAG CAGCGAGGCG 
GTGGCTGAGT GCATCCGTCG GGTCAACGTT GGTTTCCTCT TCGCCCCGCT GCACCACAGC 
GCCATGAAGC ACGCCGTGGG ACCGCGCAAG GAGCTCGGGG TCCGCACCCT GTTCAACCTG 
GTGGGCCCGT TGTCCAACCC CGCCGGGGCG CGGCGCCAGC TGCTCGGGGT CTTCGGGCAG 
GAGTGGGTGC GCCCGGTGGC CGAGGTGCTC CAGGCGCTGG GCAGCGACCA CGTGCTGGTG 
GTCCACGCCG AGGACGGGCT CGACGAGATC AGCATCGCCG CACCGACGCG GATCGCCGAG 
CTGCGCAACG GCCAGATCGA GGAGTACACC GTCACGCCGG AGGATCTGGG GCTGCGCAGC 
GCGCCGCTCA ATGAGGTGAC CATCTCCGGC ACCAAGGACA GTCTGGCGAT GATCCGTGCC 
GCCTTCTCCG GCGAGCGCAT TGCCGCCATG GAGCTGATCG CCGCCAACGC CGGCGCTGCG 
CTCTATGTTG GCGGCGAGGC CCCCGATCTG CGTCGTGGTG TGGAGCGAGC CCGGGAACTC 
ATGACCTCCG GTGCCGCCGC TCAGACGCTG GAGCGCTTCG TGGCGACGAC CAAGGAACTC 
GCCCAATGA

Protein sequence

MDLTAALRRI TENQDLSPDE MTAVFRTIMT GGATPAQIGG FLIGMRLKGE TVQEMAAAAS 
VMRELAERVD VGDDFHRLVD TCGTGGDARG TLNVSTAAAF VTAAGGIPVA KHGNRSVSGR 
SGSADLLEAC GATLELSSEA VAECIRRVNV GFLFAPLHHS AMKHAVGPRK ELGVRTLFNL 
VGPLSNPAGA RRQLLGVFGQ EWVRPVAEVL QALGSDHVLV VHAEDGLDEI SIAAPTRIAE 
LRNGQIEEYT VTPEDLGLRS APLNEVTISG TKDSLAMIRA AFSGERIAAM ELIAANAGAA 
LYVGGEAPDL RRGVERAREL MTSGAAAQTL ERFVATTKEL AQ