Gene Dret_0119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0119
Symbol
ID	8417923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	158436
End bp	159857
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	61%
IMG OID	645036684
Product	Anthranilate synthase
Protein accession	YP_003196999
Protein GI	258404257
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCAGG TGGTATTACA GCAACAAGGC CGGACTCTTC CGGCGGACAC ACAGACACCG 
ATCAGTCTGT ACCAGCAGAT GGTGGGCAAA AAACCAGGGC TGCTCCTGGA GAGTGCTGAA 
GTCGACGGTC GTTGGGGGCG TTACAGCCTT GTGGCCTGGG ATTTTCGCCT TGTGGCCTCC 
TGCCATGAGG GAAATCTCGA GCTGACGGTC AAGGATGCCC GGCTTGAGGC GCTCCGGAGC 
TATACGGGGT TGCCTTTCGA ACAAGGATTG CGCGCGCTCC TGGCCGATCT GGCGGTACAG 
CCTCCAGAGG AGCTAGCCGA TCTGCCCATT TTTTCCCGCG GTGTCTACGG ATATCTCGGC 
TACGGCCTGG CCGGGTGTTT TGAGCCCGCC TTGGCCGACC AGCTCCCTCC TGAAAAGGCT 
GAAGCCTGTC TGGTTCTGCC GGCCCATGTC CTTTTATTCG ACCATCTGCA CCACCGGTGC 
GTTCAACTCA GCCTGGACGA CACCTTCCCC AAACACGGCG GCGGGCGGCA AGTTGGCGCC 
AGCCTCGATG CCAAGCCGCG GCTGGGACAG GTGGAGACCA GACCGGACAA GGAACAATTC 
TGTCAGAGCG TGCGTCGCAT CCGGGAGGAC ATCCACAATG GAGAGGCTAT CCAGGTCGTC 
CTTTCGACCC GGTTTCAGGC CTCCTTCTCC GGAGAAGCCT TTGCTGTCTA CCGGCGCCTG 
CGTCAGTACA ACCCTTCTCC CTATATGTAT TTTTTGCGCT TGCCGGGCAC GACTATCGTC 
GGTTCGTCAC CGGAGGTCCT GGTGCGGTGT TCGGAGGGAC GGGTCGAGGA ATGCCCCATT 
GCCGGGACCA GGCACCGCGG AACCACCCGG GAGGAAGATG CAGCCCTGGC CGACGAGTTG 
GCGGCCGATC CCAAGGAGCG GGCCGAGCAC GTCATGCTTG TGGATTTGGG CCGCAATGAT 
CTGGGCCGGA TCGCTGCAGC GGGCAGTGTC CGTGTCGATA GGCTCATGCA GGTCGAACGG 
TTTTCCCATG TCATGCACCT GACCTCGTAT CTCGAGGCCG AGCTCAAGAC TGGCTTGGAC 
GCCGTGGATG TCCTTGCGGC CACGTTTCCT GCCGGCACTG TTTCCGGAGC CCCGAAGATT 
CGGGCTATGG AGACCATCGC AGAACATGAA AGCCAGCCCC GGGGGCCCTA CGCGGGGGCG 
GTGGGCTGGA TCGGGCTTGA TCCGGATCAG GTCGCCCTGG ACACCGGGAT CTGTATCCGG 
ACTTTGTGGA TCCAGTCCGG GACCATCTTC TGGCAGGCCG GGGCCGGCAT CGTGGCCGAC 
TCGGATCCGG AAAAGGAATG GCAGGAATGC CAGAACAAGG CCCGCATTTT GCGGGAAGTC 
CTTCAGGAAG AAGGGGAAAG TGATGTTTTT GCTCATCGAT AA

Protein sequence

MPQVVLQQQG RTLPADTQTP ISLYQQMVGK KPGLLLESAE VDGRWGRYSL VAWDFRLVAS 
CHEGNLELTV KDARLEALRS YTGLPFEQGL RALLADLAVQ PPEELADLPI FSRGVYGYLG 
YGLAGCFEPA LADQLPPEKA EACLVLPAHV LLFDHLHHRC VQLSLDDTFP KHGGGRQVGA 
SLDAKPRLGQ VETRPDKEQF CQSVRRIRED IHNGEAIQVV LSTRFQASFS GEAFAVYRRL 
RQYNPSPYMY FLRLPGTTIV GSSPEVLVRC SEGRVEECPI AGTRHRGTTR EEDAALADEL 
AADPKERAEH VMLVDLGRND LGRIAAAGSV RVDRLMQVER FSHVMHLTSY LEAELKTGLD 
AVDVLAATFP AGTVSGAPKI RAMETIAEHE SQPRGPYAGA VGWIGLDPDQ VALDTGICIR 
TLWIQSGTIF WQAGAGIVAD SDPEKEWQEC QNKARILREV LQEEGESDVF AHR