Gene Dret_0121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0121
Symbol
ID	8417925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	160436
End bp	161443
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	64%
IMG OID	645036686
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_003197001
Protein GI	258404259
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.338253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCAG CTGTTGCCAT GAATACCATT TTGGACCATG TCGCGGACGG GCAGGATCTT 
GCGCCGGAGA TGGCCCGGGC CTGTTTTGAC CATCTGTTTT CCGGCCATTG CCCACCGGCT 
CAGGCTGGCG GGCTTTTGCT CGCGCTTAGG GCCAAAGGAG AAACCGGGCT GGAACTCGCC 
GCCGCGGTGC AAGCGGCTTT GCAACAGGCT CGGACCGTCA GCGGACTGAC CCGTCCCAGG 
ATCGATACCT GTGGAACCGG GGGAGACAAT AAGAGCAGCT TCAATTGCTC CACGGTGGTG 
GCCCTGTATC TGGCCGATAT GGGATACGAT GTTGTCAAGC ACGGCAACCG GGCCGTCTCT 
TCGTCCTGCG GCAGTGCCGA TGTGGTTGAG GCCTTGGGAT TGCCCTTTGC CGAGCAGGAA 
AACGATGTCC ATTCCGGGCT CGCCCGGTCG CGGTTCGTCT TTCTTTTCGC TCCCCATTTC 
CATCCCGCGT TCGCCAAGCT CGGGCCCATC CGGAAAGATC TCGGCGTGCG GACGCTGTTC 
AATCTCCTTG GCCCGCTGCT CAATCCGGCT CGCCCGACCC ACCAATTGCT CGGCGTCCCC 
CGGAGCCAGT TCATGCAGCC GGTAGCCGAC GCCCTGGCCC TGTCTGGCAT CCAGCGCGCC 
GCGGTGGTGC ATGGCGCTGG AGGGTATGAC GAGCTGACCC CATTGGGGCC CAACCGGTGC 
CTTGTTGTGG ATAATGGCGA AGTGGTGCGC CGGGATATCG ACCCGGCCGC ATTCGGCATT 
GCCACCTGCG ACGAGGCGGC CCTGGCCTGC CGGGACAAGA CAGAGGCCCT GGAAGTGGTT 
CGGGCCCTGC TCCAGGGACG CGGGCCCCAG GCGATGCAGG GTATGCTCGC CTTGAATCTG 
GGTGTGGCCC TTTTCCTTCT CGAGCCGGAA TTGTCCCTTG ACGCCGCCGT AGCCAGGGCC 
TGCGAGGCCG TCAGCCGGGG CATCAGCAAG GAGGTGGCCT GTGCTTGA

Protein sequence

MNAAVAMNTI LDHVADGQDL APEMARACFD HLFSGHCPPA QAGGLLLALR AKGETGLELA 
AAVQAALQQA RTVSGLTRPR IDTCGTGGDN KSSFNCSTVV ALYLADMGYD VVKHGNRAVS 
SSCGSADVVE ALGLPFAEQE NDVHSGLARS RFVFLFAPHF HPAFAKLGPI RKDLGVRTLF 
NLLGPLLNPA RPTHQLLGVP RSQFMQPVAD ALALSGIQRA AVVHGAGGYD ELTPLGPNRC 
LVVDNGEVVR RDIDPAAFGI ATCDEAALAC RDKTEALEVV RALLQGRGPQ AMQGMLALNL 
GVALFLLEPE LSLDAAVARA CEAVSRGISK EVACA