Gene Arth_2767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2767
Symbol	hemC
ID	4444566
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3118965
End bp	3119963
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	70%
IMG OID	639690589
Product	porphobilinogen deaminase
Protein accession	YP_832246
Protein GI	116671313
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00352178
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGGTCC GCATCGGGAC GCGTGCCAGC AAGCTGGCGT TGACCCAGAC CCAGCAAACA 
GCCGACCAGC TCGCCGCCAT TGGCGGGTTC CCCGTGGAAC TGGTGCACAT CAGGACGGAC 
GGGGACGTCC TGACCGGTTC GCTCTCGCAG ATGGGCGGCA CGGGAGTTTT TGTGGCGGCC 
TTGCGGGAGG CGCTCCTGCG GGACGACTGC GACGTTGCCG TGCACTCGCT CAAGGACCTG 
CCCACCGGAG CCGCGCCCGG GCTGAACCTC GCCGCGACGC CGAAGCGCGT CGACGTCCGT 
GACGTGCTCT GCGCGCGCGA CGGTTTCAAG CTGGCCGACC TCCCGCAGGG CGCCCGGGTG 
GGAACCGGTT CCCCGCGCCG AGCGGCGCAG CTCCGCGCGG CCCGTCCCGA CCTTGACGTC 
GTGGACATCC GTGGCAACGT GGACACCCGC CTGGGTCGTG TTCCCGGCCT GCCGGGCAAC 
ACCACGGATG CCGTGGTGTT GGGCAAATCC TGCGACCTCG ACGCCGTCGT GTTGGCCGCC 
GCCGGCCTCG AGCGCATCGG CCGGCTGGAC ACCGTTAGCG AATATCTCGA AACAGATGTC 
ATGCTTCCGG CCGCCGGCCA GGGGTCGCTT GCCATCGAGT GCCGCACTGC GGACGCTCCG 
CGAAGAACGG GATCCACCGA AGGGTCCCAG GGGCCGCTGG CCCAGGCGCT GGCAGCCCTG 
GACGACACGG ACACCAGGCT CGCGGTTACG GCCGAACGGG CGCTCCTGGC CCGTCTGGAG 
GCAGGGTGCG CAGCCCCGGT GGGTGCCTAC GCCTTCCGCA AGGGAAGCAT GCTCTACCTG 
GAGGCCGCCG TCTGCGCTGT CGACGGGTCA GCCACCGTCC GCGACAAGCG GGCGACGGAC 
GGGCTCACCG AGGTCGGCGC TACGCTTCTT GGCATCGAAC TGGCTGAGGC GCTGCTGGCA 
GCCGGTGCAG CCGACATCGC GGACCTTGCC GCTTCCTGA

Protein sequence

MTVRIGTRAS KLALTQTQQT ADQLAAIGGF PVELVHIRTD GDVLTGSLSQ MGGTGVFVAA 
LREALLRDDC DVAVHSLKDL PTGAAPGLNL AATPKRVDVR DVLCARDGFK LADLPQGARV 
GTGSPRRAAQ LRAARPDLDV VDIRGNVDTR LGRVPGLPGN TTDAVVLGKS CDLDAVVLAA 
AGLERIGRLD TVSEYLETDV MLPAAGQGSL AIECRTADAP RRTGSTEGSQ GPLAQALAAL 
DDTDTRLAVT AERALLARLE AGCAAPVGAY AFRKGSMLYL EAAVCAVDGS ATVRDKRATD 
GLTEVGATLL GIELAEALLA AGAADIADLA AS