Gene Daro_3640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3640
Symbol	hemH
ID	3568285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3914242
End bp	3915174
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	64%
IMG OID	637682113
Product	phosphoribosylaminoimidazole-succinocarboxamide synthase
Protein accession	YP_286839
Protein GI	71909252
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0152] Phosphoribosylaminoimidazolesuccinocarboxamide (SAICAR) synthase
TIGRFAM ID	[TIGR00081] phosphoribosylaminoimidazole-succinocarboxamide synthase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.00000209948
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCTC CGCTTTTCGA ATCCACCATC ACCAGCCTGC CCCTGATCAA CAAGGGCAAG 
GTCCGCGACA TCTACGCCGT CGACGCCGAC AAGCTGCTGA TCGTCACCAC CGACCGCCTG 
TCCGCCTTCG ACGTCATCCT GCCGGACCCG ATTCCGCGCA AGGGTGAAGT CCTGCAGGCT 
GTCGCCAATT TCTGGTTCGA CAAACTCGGC CACATCGTCC CGAATCAACT GACCGGCATC 
GATCCCGAAA CCGTCGTTGC TGAAAACGAA CGTGAGCAAG TCCGTGGCCG TGCCGTCGTC 
GTCAAGCGCC TGAAACCGCT GCCGATCGAA GCCGTCGTCC GTGGCTACGT GATCGGTTCC 
GGCTGGAAGG ACTATCAGGA AACCGGTGCC ATCTGCGGCA TCGCGCTGCC GGCCGGCCTC 
AAGATGGCCG CCAAGCTGCC CTCTCCGATC TTCACGCCGG CCACCAAGGC CGCCGTCGGT 
GACCATGACG AGAACGTCTC CTTCGCCACT GCCCAGGCCA ACTGCGCCGC CGACCTCGCC 
GAAGCGCTGG CCGGCACCGG CAAGAACGGT GCCGGACTGG CCGACGAAGC CCGCATCGCC 
GCCATCCGCC TGTACGAAGA AGCCTCCGCC TACGCCCGTG GCCGCGGCAT CATCATCGCC 
GACACCAAGT TCGAATTCGG CATCGATGCC GCCGGCACCC TGCACCTGAT CGACGAAGCC 
CTGACCCCGG ATTCCTCGCG TTTCTGGCCA GCCGACCATT ATCAGGAAGG CAGCAACCCG 
CCGTCCTACG ACAAGCAATA CGTCCGCGAT TACCTCGAAA CCCTGGACTG GGGAAAAGTC 
GCCCCCGGCC CCAAACTGCC GGCCGACGTC ATCGCCCGCA CCAGCGCCAA GTACATCGAA 
GCCTACGAAA AGCTGACCGG CAAGACGCTG TAA

Protein sequence

MTAPLFESTI TSLPLINKGK VRDIYAVDAD KLLIVTTDRL SAFDVILPDP IPRKGEVLQA 
VANFWFDKLG HIVPNQLTGI DPETVVAENE REQVRGRAVV VKRLKPLPIE AVVRGYVIGS 
GWKDYQETGA ICGIALPAGL KMAAKLPSPI FTPATKAAVG DHDENVSFAT AQANCAADLA 
EALAGTGKNG AGLADEARIA AIRLYEEASA YARGRGIIIA DTKFEFGIDA AGTLHLIDEA 
LTPDSSRFWP ADHYQEGSNP PSYDKQYVRD YLETLDWGKV APGPKLPADV IARTSAKYIE 
AYEKLTGKTL