Gene Dshi_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1842
Symbol	purB
ID	5712834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1923555
End bp	1924907
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	64%
IMG OID	641267766
Product	adenylosuccinate lyase
Protein accession	YP_001533185
Protein GI	159044391
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.333164
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCGTA TGACGCCCGC AAACTGTGTC AAACGCAAGG CTCCGCCCAT GATCCCCCGC 
TATTCCCGCC CCGATATGGT CGCCATCTGG TCGCCCGAGA CCAAGTTCCG CATCTGGTTC 
GAGATCGAGG CCCATGCCTG CGACGCCATG GCGGATCTCG GGGTGATCCC GCGCGAGAAT 
GCCGAGGCCG TGTGGAAGGC CCGGGATGTG GAGTTCGACG TGGCCCGCAT CGACGAGATC 
GAAGCGGTGA CAAAGCATGA CGTGATCGCG TTCCTGACCC ATCTGGCCGA ACATGTCGGC 
GCCGAAGAGG CGCGCTTCGT GCACCAGGGC ATGACCTCGT CCGATGTGCT CGACACCTGT 
TTCAACGTGC AGCTGACCCG CGCGGCAGAT ATTCTTATCA AGGACTTGGA AGACCTTCTT 
GAAGCTTTGA AGCGCCGCGC GCTGGAACAC AAGGACACCG TCCGCATCGG CCGGTCCCAC 
GGCATCCATG CCGAGCCGAC CACGATGGGC CTGACCTTCG CGCGGTTCTA CGCGGAAATG 
GACCGCAATC TCAGCCGGAT GCGCGACGCC CGGGCCGAGA TCGCCACGGG CGCGATTTCG 
GGCGCGGTCG GCACATTCGC CAATATCGAC CCGCGCGTGG AAGAGCATGT CTGCGACAAG 
CTCGGCCTGG TGCCCGAGCC GATCTCCACC CAGGTGATTC CGCGCGACCG GCACGCGGCC 
TTCTTCGCCA CGCTCGGCGT CGTGGCGTCG TCCATCGAGA ATATCGCGGT GGAAATCCGC 
CACATGCAGC GCACCGAAGT GCTGGAGGGG GCGGAGTTCT TCTCCATGGG GCAGAAGGGC 
TCCTCGGCCA TGCCCCACAA GAAGAACCCG GTGCTGACCG AGAACCTGAC GGGGCTGGCG 
CGCATGGTCC GCTCGGCGGT GATCCCGGCG ATGGAAAACG TCGCGCTGTG GCACGAGCGG 
GATATCTCGC ACTCCTCGGT CGAACGCATG ATCGGCCCCG ATGCGACCAT CACGCTGGAT 
TTCGCGCTGG CGCGGCTCAC CTCGGTCGTG GACAAGATGC TGATCTTCCC CGAGAACATG 
CTGGAAAACA TGAACAAGTT CCCGGGGCTC GTGATGAGCC AGCGGGTGCT CCTGGCCTTG 
ACCCAGGCCG GCGTGAGCCG CGAGGATGCC TATACCTATG TGCAGCGCAA CGCGCTCAAG 
GTCTGGGAGC ATCGGACCGA TTTCAAGGCC GAACTGCTGG CCGACCCGGA TGTCACCGCT 
GCCCTCAGCC CCGCCGAGAT CGAGGAGAAA TTCGACCTAG GCTATCATAC CAAGCATGTG 
GACACGATAT TCGCCCGGGT TTTCGGCGAC TGA

Protein sequence

MPRMTPANCV KRKAPPMIPR YSRPDMVAIW SPETKFRIWF EIEAHACDAM ADLGVIPREN 
AEAVWKARDV EFDVARIDEI EAVTKHDVIA FLTHLAEHVG AEEARFVHQG MTSSDVLDTC 
FNVQLTRAAD ILIKDLEDLL EALKRRALEH KDTVRIGRSH GIHAEPTTMG LTFARFYAEM 
DRNLSRMRDA RAEIATGAIS GAVGTFANID PRVEEHVCDK LGLVPEPIST QVIPRDRHAA 
FFATLGVVAS SIENIAVEIR HMQRTEVLEG AEFFSMGQKG SSAMPHKKNP VLTENLTGLA 
RMVRSAVIPA MENVALWHER DISHSSVERM IGPDATITLD FALARLTSVV DKMLIFPENM 
LENMNKFPGL VMSQRVLLAL TQAGVSREDA YTYVQRNALK VWEHRTDFKA ELLADPDVTA 
ALSPAEIEEK FDLGYHTKHV DTIFARVFGD